这个项目优先补“可复核来源”,而不是为了数量扩表。data/source-leads.csv 是来源种子池:它记录每个方向至少 5 个公开入口,帮助维护者继续发现公司、招聘主页、活动和项目线索。
data/source-leads.csv 已覆盖 9 个方向。data/companies.json,并保留公司官网、官方页、招聘主页或政府公告等 item-level 来源。data/source-leads.csvinternship 或 hiring。source_type: recruiting_platform
verification_status: community_pending
opportunities: ["unknown"]
confidence_score: 3
source_type: official_site / official_profile
verification_status: verified / official_page
confidence_score: 4-5
可以收录:
不要收录:
data/communities.csv 与 data/events.csv 目前收录的是公开入口和搜索入口,不代表已经确认某个社群长期活跃,也不代表当前有具体活动。
后续把具体活动入库时,至少需要:
status 标记为 upcoming / past / source_search_page从 COMPANIES.md 的优先核验清单开始,把 community_pending 记录逐条查官网或官方主页。
使用 data/source-leads.csv,只补公司主页或招聘主页,不补岗位承诺。
从高校学院、就业网、创新创业学院、实验室、学生技术社团公开页开始。
从活动行、百格活动、科技厅通知、园区活动页里找技术、AI、数据、创业活动。
从公共资源交易、政府采购、科技项目通知中找信息化、软件、数据平台、智慧城市项目。
优先补农业数字化、医疗信息化、文旅科技、网络安全这些信息更分散的方向。
运行:
npm run generate:companies
npm run export:csv
npm run validate
然后把新增来源和仍待复核项写进 Issue 或更新日志。
这个项目的价值不是“公司越多越好”,而是让每条线索都能回到公开来源。不能确认就标 community_pending;来源弱就写 confidence_score: 2-3;没有招聘证据就保留 opportunities: ["unknown"]。