107 被遗忘的名单 (第2/3页)
物交易中心”、“全球即时翻译网”、“家庭自动化门户”。它们曾在IPO路演中描绘未来蓝图,最终却连服务器电费都无力支付。
她迅速将整份报纸拍照扫描,又顺手翻查其余几份同期刊物,确认这份名单是当时唯一一次集中公示。随后她原路返回,雨水顺着发梢滴落在背包封口。
回到机房时,陈帆正站在白板前画结构图,李航则在调试新的数据清洗脚本。
“找到了。”周婷把平板放在桌上,调出扫描件,“这是目前能看到最完整的.com公司集体记录。”
三人围拢过来。
“这上面有五百多家。”李航放大页面,“光靠人工录入太慢,而且很多公司用了缩写或者别名,很难对应到现在的股票代码。”
“先挑典型样本。”陈帆指着其中一组,“比如这家‘NetMall Inc.’,主营线上百货,烧钱扩张,没有盈利模式。再看这家‘eHome Solutions’,概念炒得热闹,实际营收几乎为零。它们的共同点是什么?”
“高估值、低现金流、业务虚浮。”周婷回答。
“那就把这些特征抽象出来。”陈帆转向李航,“你写个识别逻辑,不看当前股价,也不看新闻热度,就看一家公司是否符合这三类标签。”
李航立即动手。他以名单中的前五十家公司为种子样本,提取注册地、主营业务关键词、融资轮次、创始人背景等维度,构建了一个初步的匹配模型。
与此同时,周婷开始手动补全残缺信息。有些公司名称因油墨渗透而模糊不清,她通过交叉比对纳斯达克历史退市公告、美国证券交易委员会档案以及当年科技杂志报道,逐一还原。
两个小时过去,第一批结构化数据导入系统。
分析模块启动瞬间,整个主屏骤然刷新。
原本分散分布的风险评分点,开始自动聚合成片状区域。三百余只当前活跃的科技股被标记为“高度复现风险”,其命名方式、商业模式、资本路径与名单中已倒闭公司高度相似。
更关键的是,系统回测结果显示:若以该名单作为负面样本库参与建模,过去三个月内对暴跌股的预测准确率从61%跃升至89%。
“不是巧合。”李航低声说,“这些公司在复制失败模板。”
陈帆凝视着屏幕上那份泛黄报纸的扫描影像。那些褪色的铅字仿佛有了重量,压在每一行跳动的数据之上。
“我们一直以为是在对抗市场情绪。”他说,“其实是在和一段被遗忘的历史赛跑。”
周婷没有接话。她正在优化算法权重,尝试加入“公众记忆衰减系数”——越是久
(本章未完,请点击下一页继续阅读)