这个项目的可信度来自两件事:只收录公开可核验信息,并且把不确定性标出来。
可以收录昆明及云南范围内,和技术、软件、数据、系统集成、数字化交付有关的公司、机构或团队,包括:
暂不收录:
一家公司满足以下任一条件,可以作为候选:
如果只从名字看像“科技公司”,但没有公开业务说明,应标记为 community_pending,不要写成已核验。
source_type 的含义| 值 | 含义 |
|---|---|
official_site |
公司官网或产品官网 |
official_profile |
官方公众号文章、集团页面、官方新闻或机构主页 |
government_public_list |
政府公告、科技型中小企业名单、公共资源交易、采购公告等 |
community_list |
旧社区清单、开源清单、社区整理资料 |
recruiting_platform |
Boss 直聘、智联招聘、前程无忧、猎聘、拉勾等公开招聘平台公司主页或搜索入口。只能说明“公开可查”,不能自动推断正在招聘。 |
media_database |
媒体报道、项目数据库、投融资/企业资料平台 |
public_web |
其他公开网页 |
unknown |
来源类型暂不清楚,后续应补充 |
verification_status 的含义| 值 | 含义 |
|---|---|
verified |
找到官网或产品官网,且与公司名称/业务方向基本对应 |
official_page |
找到官方文章、集团页面、政府公告等官方来源,但可能缺少独立官网 |
community_pending |
来自社区清单、公开名单或平台页,需要继续补官网和业务方向 |
outdated |
来源可能过期,页面失效或信息明显陈旧 |
unknown |
暂未能判断核验状态 |
confidence_score 评分规则| 分数 | 规则 |
|---|---|
| 5 | 官网已核验,官网和业务方向清楚 |
| 4 | 官方页核验,来源可靠,但缺少独立官网或信息不完整 |
| 3 | 招聘平台、媒体数据库或公开网页可支持基本存在,但还缺官网或业务交叉验证 |
| 2 | 政府公开名单、社区历史清单等候选来源,只能说明“值得复核” |
| 1 | 来源弱、信息不完整或状态未知,应优先复核 |
opportunities 的含义opportunities 是阅读提示,不是承诺,不代表公司正在招聘或正在接外包。
允许值:
internship:有公开实习线索。hiring:有公开招聘线索。outsourcing:从公开业务看,可能与外包、网站建设、软件交付有关。partnership:从公开业务看,可能与合作、客户、产业项目有关。unknown:暂时不判断。没有明确招聘页时,不要编造 internship 或 hiring。如果只是发现招聘平台搜索入口,应该先放在 data/source-leads.csv,或在公司记录里保守使用 source_type: recruiting_platform、opportunities: ["unknown"]。
suitable_for_* 字段这些字段表示“适合谁阅读这条记录”,不是业务承诺。
suitable_for_students:适合学生了解行业、找项目方向或实习研究入口。suitable_for_freelancers:适合自由职业者研究外包/交付/合作可能性。suitable_for_job_seekers:适合求职者进一步查官网、招聘页或公开岗位。suitable_for_founders:适合创业者研究客户线索、产业方向或合作对象。如果官网打不开、公司名称变更、业务方向明显变化:
verification_status 改为 outdated,在 notes 里写明“待复核”。website、source_url、source_type、last_checked。不要收录:
如果某条公开来源包含第三方私人联系方式,只保留来源链接,不把私人联系方式复制进数据字段;维护者本人主动公开的项目联系入口可以出现在 README 或页面 CTA 中。