首页 › 方法论
方法论
这一页讲清楚:数据从哪来、按什么口径整理、中文解读如何生成,以及我们刻意不做什么。判断一个数据站可不可信,靠的就是把方法摊开。
一、数据采集
本站持续追踪美国证券交易委员会(SEC)EDGAR 系统的公开申报,并接入若干公开数据源。覆盖范围:
· 内部人交易 / 高管持股异动(Form 3/4/5)
· 机构持仓(13F)、举牌 / 大额持股(13D/13G)、拟出售备案(Form 144)
· 8-K 衍生披露:财报速读(Item 2.02)、股票回购、股息与拆股
· 高管薪酬(DEF 14A)、IPO(S-1 等)、退市 / 换所(Form 25)、执法行动(SEC 诉讼公告)
· 宏观指标(美联储 FRED)、日终行情(Yahoo Finance)、空头成交(FINRA Reg SHO)、议员交易(美国参议院 eFD)
抓取严格遵守各源的访问规范:对 EDGAR 带可联系的标识(contact@readmarkets.com)、限速访问、按精确表单类型过滤,并对同一申报在发行人与申报人两个 CIK 下的重复出现做去重。各栏目的具体来源、口径与更新频率见 数据来源。
二、整理与口径
原始申报会按统一口径结构化后入库,关键口径包括:
· 事件聚合:同一份申报内同代码、同日分笔的多行,合并为一个事件——金额加总、价格以区间呈现;排行与「第几次」均按事件计,不按原始行数虚增。
· 持股口径:交易后持股按直接 + 间接合并展示,并分行注明持有方式(对信托大户,只取直接持股会严重失真)。
· 修订(/A)处理:当一份修订件(如 4/A)到达,被修订的原件会从历史对照中剔除、避免同一笔交易双重计入;修订后的版本重新冻结刷新。
· 交易代码语义:P 为公开市场买入、S 为卖出、M 为行权、A 为授予、F 为缴税代扣、G 为赠与——不同代码的经济含义不同,不混为一谈。
· 金额与币种:13F 市值自 2023 年起为美元口径、更早档为千美元,按提交期分别处理;看跌期权(Put)绝不计入多头持仓。
· 区间披露:议员交易金额按法定区间报告,本站照实呈现区间、不取中值臆造精确数。
三、中文解读如何生成
部分申报附有一段中文解读。它的唯一信息来源是该申报本身的结构化字段(股数、价格、职务、持股、日期等)——这些数字全部取自申报原文。解读严格遵守一条铁律:
这样做是为了从源头杜绝杜撰:解读越「忠于输入」,越不可能编出数据里没有的事。每页同时附 SEC 原始文件链接,读者可逐位核对。
四、常驻页与更新
本站的命题是「每一条申报都是一页永久数据」。实体页(公司、人物、基金、排行)实时读取数据库呈现最新状态;逐条详情页一经生成即冻结存档,原网址长期稳定可访问。当原始申报被修订,对应页面会随之刷新到修订后的口径。
五、我们刻意不做什么
· 不荐股:不给买卖建议、不设目标价、不做估值判断或市场反应预测。
· 不补外部事实:解读不引入申报之外的信息。
· 不混淆概念:「内部人交易 / 高管持股异动」是依法向 SEC 提交的合法公开申报,与中文语境里指代违法的「内幕交易」是两回事;空头成交量不等于空头持仓;执法的「指控」不等于「定罪」;Form 144 是「拟出售 / 备案」、不等于「已减持」。