【灵蛇献瑞】| 2024 中国开源年度报告正式发布!
【中国开源年度报告】由开源社从 2015 年发起,是国内首个结合多个开源社区、高校、媒体、风投、企业与个人,以纯志愿、非营利的理念和开源社区协作的模式,携手共创完成的开源研究报告。后来由于一些因素暂停,在 2018 年重启了这个项目一直至今,每一年参与协作的伙伴社区/单位和志愿者以及点评的开源大咖越来越多,还有更多的忠实读者表示每年年初都期盼能看到中立、客观、多元而优质的【中国开源年度报告】。我们希望今年呈现给所有关心、热爱开源的读者们更优质的内容,也欢迎大家给予这份报告建议、意见和反馈,让我们能精益求精,乘“巳”而上!
复制以下链接到浏览器搜索可阅读完整版报告哦!
全文链接:https://kaiyuanshe.github.io/2024-China-Open-Source-Report/
2024 中国开源年度报告项目组
自 2015 年开源社首次发布「中国开源生态系统报告」至今,「中国开源年度报告」已迈入第 10 个年头。除了 2017 年因故断更外,开源社每年都通过开放式协作的方式,邀请活跃在学界、业界和社区中的伙伴们一起,在下一年度的展卷之际,为大家奉上上一年度开源发展趋势的报告与洞察,共同描绘中国开源生态的全景图。
作为中国唯一由完全中立的非营利性开源组织发起的开源年度报告,它的意义早已超越了一份单纯的数据分析或趋势展望。报告记录了开源技术、文化与社区在中国的生根发芽与蓬勃发展,见证了开源在推动技术创新、产业升级和社会协作中的重要作用。同时,借助于社区力量陆续发布的英文 & 日文版本,也为想要参与和了解中国开源的全球开源力量打开了一扇窗,搭建起了连接中国与全球社区的桥梁。
回到「2024 中国开源年度报告」,开源 AI 依旧是本份报告的一个重要看点。2022 年底 ChapGPT 横空出世之后,2023 年堪称是人工智能发展最关键的一年,而在 2024 年,开源 AI 的井喷式爆发彻底改写了行业规则—— 从技术垄断到全民共创,从实验室创新到产业落地,一场由开源主导的 AI 范式革命已然到来。因此 2024 年中国开源年度报告决定将《开源人工智能篇》单列出来,以更为全面的方式,向读者呈现。
同时,开源人工智能的井喷式发展也在本份报告的其他多个篇章中皆有所体现,比如:
在问卷篇中,我们看到结合开放问题「开源关键词」的调研结果制作的词云图中,最明显的几个关键词便是 AI、人工智能与大模型;
在数据篇中,GitHub 活跃开发者数量在历经 2022 至 2023 年的增长放缓后,增长率得以回升,这可能与新技术浪潮(如 AI、Web3 等)带来的新增开发者有关。同时,生成式 AI 开源项目的发展也逐渐进入了存量市场的竞争;
在商业化篇中,我们看到资本市场对于开源的投入趋于冷静,但 AI 和开源软件为行业带来了寒冬中的希望;
「开源人工智能」从开源大事记中被独立成篇后,今年的开源大事记,主要是梳理人工智能技术发展之外的大事,但依旧处处离不开 AI 的影子 —— 当 AI 开始编写代码、当地缘政治切割技术生态、当法律判决定义开源边界,我们正站在开源发展史的关键转折点。我们希望这份汇聚技术突破、安全警示、商业探索与政策思辨的开源大事记,能为中国开源参与者提供穿越变革的航标——因为明天的开源规则,将由今天的实践者共同书写;
除了 AI 这一重要看点,本份报告还在多个方向有所创新,值得读者关注 ——
在数据篇中,我们进行了一系列数据更新:OpenDigger 新增了全球各国国家级及国家内部一级行政区划(省、州)标签数据,全球及国内开发者排行榜更新为一级行政区划开发者数量与影响力排行榜;OpenDigger 新增了数百个项目级标签,以此我们在今年的全球影响力排行榜中新增 2024 全球项目新势力排行榜,只有 2024 年新开源的项目可以入选;OpenDigger 新增了 1000 多家企业相关标签数据,并以此新增了商业开源洞察;OpenDigger 新增了 OSPP 2022 至 2024 年标签数据,并以此新增了高校开源洞察;
在数据篇中,我们在原本总体宏观洞察篇、OpenRank 排行榜篇、企业洞察篇、基金会洞察篇、技术领域洞察篇、开源项目洞察篇和开发者洞察篇的基础上,增加了商业开源洞察和高校开源洞察,商业开源洞察篇聚焦中国及全球商业开源企业和项目的发展现状和趋势,分析商业开源企业的表现及成长路径;高校开源洞察篇介绍了开源之夏 OSPP 活动的举办情况,并结合 OpenRank 社区算法及其指标分析了相关高校与学生的表现情况,展现了高校学生参与开源活动的相关趋势。除此之外,在开源项目洞察中,我们首次尝试用 OSGraph 呈现了开源项目的社区协作网络。
在商业化篇中,我们首次采用了访谈的形式进行内容呈现,我们访谈了几位专注于开源技术、基础软件、云服务的投融资专家,在于他们的访谈中,总结和分析过去几年开源软件领域内的发展和对未来资本市场的展望。同时他们也坦诚地分享了个人职业发展中对于该领域的认识与理解,以及对于开源企业商业化与增长的经验与看法。
在开源社和「中国开源年度报告」十年之际,我们更深刻地意识到,这不仅仅是一份年度报告,更是一种开放式协作的实践,以及一年又一年贡献到年报内容编纂、数据分析、项目管理、排版设计的志愿者们对开源精神的致敬。
十年来,我们始终秉持开放协作的初心,努力让每一份报告都更加贴近时代的脉搏与读者的期待。今年,我们尝试在内容和形式上进行更多创新,希望能够为您带来焕然一新的阅读体验。不论您是开源的践行者、观察者、还是同行者,愿这份报告能为您带来启发与收获,与我们一同见证中国开源生态的精彩未来。
—— 江波,开源社 2024 年度理事长
谨以本份报告,向过去十年贡献到年报内容编纂、数据分析、项目管理、排版设计的志愿者们致以最诚挚的感谢。
2024年中国开源年度报告主要由五部分组成,分别是问卷篇、数据篇、商业化篇、开源人工智能篇、大事记篇。
01
问卷篇
报告背景
自 2016 年初发布的《2015 年中国开源社区参与调查报告》起,开源社持续发布年度开源开发者调查报告,致力于多维度呈现中国开源发展的现状与趋势。2024 年,我们继续沿用这一传统,并借助数据分析手段和调查报告工具,进一步绘制中国开源世界的地图,帮助开源社区、开发者和业界人士深入了解国内开源生态的变迁。
本问卷篇将继续关注开源社区中各个层级的参与情况,旨在通过多维度问题,深入了解受访者的个人信息、工作状况、开源社区参与情况以及开发者的技术背景等。本问卷根据开源社区的参与深度,设定了多个角色层级,包括使用者、参与者、贡献者、维护者和生态运营等,旨在全面反映开源社区内不同层级用户的参与情况与影响力。具体定义如下:
使用者:使用过某一款或某几款开源产品的用户
参与者:与开源社区有互动行为的用户(例如与开源社区交流沟通、参与开源社区组织的活动等)
贡献者:对开源社区有实质性的贡献的用户(包括代码贡献和非代码贡献)
维护者:主要负责对开源社区日常运营的用户(包含项目 maintainer、PMC 成员等)
另外,生态运营为主要负责对开源社区日常运营的用户, 层级在参与者之上,与维护者统称为运营者。
与往年类似,本问卷除了涵盖基础信息外,还针对不同角色群体的特点,设计了针对性问题,深入了解各个层级的参与动机、贡献模式和影响力。
本次调查问卷的基本信息如下:
调查对象 :覆盖开发者、社区成员、贡献者、学生、政府企业管理人员
调查内容 :主要涵盖个人信息、工作状况、开源社区以及开发者技术等
调查方法 :以在线问卷方式搜集样本和数据,交叉对比法分析数据
分发渠道 :线上公众号推广,以及线下开源社、OSCAR 中国产业大会、PyCon、2024第九届中国开源年会等多渠道发放。
问题类型 :单选、多选、开放性
问题数量 :41
样本量 :631
受访者心中的 2024 年开源关键词
根据 2024 年开源关键词词云图,我们可以概括出受访者在新的一年里最关心的几个主题:
技术创新:关键词如 “ 创新 ”、“ 智能 ”、“ 大模型 ”表明,受访者高度关注技术领域的最新进展,尤其是人工智能和大型模型技术的发展。
开源生态:词汇 “ 开源 ” 、“ 共享 ”
2024 年开源关键词词云图
02
数据篇
2024 中国开源年度报告以全面、深入的数据洞察为核心,通过九大篇章全方位展现中国开源生态的蓬勃发展。第一部分宏观洞察篇,从基础事件、活跃仓库、活跃用户和编程语言等维度,揭示中国在全球开源生态中的独特地位与影响力。第二部分 OpenRank 排行榜篇,通过全球与中国各领域的开源项目、企业、基金会、开发者及协作机器人排名,为业界提供权威、系统的 OpenRank 指标信息服务,成为衡量开源贡献的重要标尺。第三、四部分企业洞察篇与基金会洞察篇,通过动态演变图和趋势分析,深度解析全球与中国企业、基金会在开源领域的战略布局与演化路径。第五部分技术领域洞察篇,聚焦各领域 Top10 榜单与项目变化,精准捕捉前沿技术的发展方向与创新趋势。第六部分开源项目洞察篇,深入探讨项目类型、领域与主题的多样性,展现开源生态的活力与创新潜力。第七部分开发者洞察篇,通过开发者类型、工作时间分布、地区分布及机器人使用情况的分析,描绘开发者群体的多元化特征与工作模式。第八部分商业开源洞察篇,聚焦中国及全球商业开源企业与项目的发展现状,剖析其成长路径与成功经验。第九部分高校开源洞察篇,结合开源之夏 OSPP 活动与 OpenRank 社区算法,展现高校学生参与开源活动的活跃度与贡献度,揭示开源人才培养的新趋势。整体而言,数据篇以丰富的数据维度与深度的分析视角,勾勒出 2024 年中国开源生态的全景图,为行业提供宝贵的洞察与参考。
03
商业化篇
开源软件的商业化是指在开源软件的基础上,通过各种策略和模式,将其技术、服务等转化为可盈利的业务,从而实现经济价值和可持续发展。开源软件的商业化能力是软件及其生态可持续发展的重要动力,也是开源软件企业在发展过程中面临的最艰巨的挑战。
往期开源年报,商业化篇以综合研究报告形式呈现,由时任云启资本的投资人徐至行先生主笔撰写,内容翔实、客观全面、洞察深入,为中国开源产业的研究提供了重要的内容资料。
今年则以访谈的形式组织商业化篇的内容,内容访谈了四位专注于开源技术、基础软件、云服务的投融资专家,他们分别是徐至行(国方创新)、刘景媛(德联资本)、丁宁(INP)和刘超(Atypical Ventures)。在于他们的访谈中,总结和分析过去几年开源软件领域内的发展和对未来资本市场的展望。同时他们也坦诚地分享了个人职业发展中对于该领域的认识与理解,以及对于开源企业商业化与增长的经验与看法。
04
开源人工智能篇
2022 年底 ChapGPT 横空出世之后,2023 年堪称是人工智能发展最关键的一年,而在 2024 年,开源 AI 的井喷式爆发彻底改写了行业规则——从技术垄断到全民共创,从实验室创新到产业落地,一场由开源主导的 AI 范式革命已然到来。因此 2024 年中国开源年度报告的大事记篇决定将《开源人工智能篇》单列出来,以更为全面的方式,向读者呈现。
2024 年 7 月 27 日,Meta 首席执行官扎克伯格发表了【人工智能即将迎来开源的拐点】的重磅文章。他强调了开源 AI 发展对整个行业的巨大影响,表示随着 AI 技术的进步和社区合作的增强,开源将成为推动创新和普及 AI 的关键。文章里的几个要点,很好地总结了开源人工智能的现状与发展趋势:
开源 AI 的崛起:越来越多的公司和研究机构开始发布开源的 AI 模型和工具,这种趋势正改变着行业竞争格局。开源推动了技术民主化,使更多开发者和企业能够利用顶尖的 AI 技术。
商业与技术的平衡:企业通过开源 AI 吸引开发者生态系统,同时将闭源技术与开源技术相结合,构建独特的商业优势。这种双轨策略使企业既能从开源中获益,又能保持核心技术的竞争力。
社区与协作的重要性:开源 AI 成功的关键在于活跃的开发者社区和协作文化。这些社区为模型改进、问题修复以及新功能开发提供了强大支持,显著加速了 AI 技术的创新速度。
伦理与透明性:开源 AI 为 AI 技术的透明性和问责制提供了新的可能。开源代码使得模型的训练和决策过程更加清晰,帮助应对偏见和伦理问题。
未来的挑战:尽管开源 AI 充满潜力,但仍面临一系列挑战,包括版权保护、数据隐私、安全漏洞以及商业可持续性。行业需要找到应对这些问题的解决方案,才能充分释放开源 AI 的潜力。
正如扎克伯格所断言的 “开源是 AI 未来的方向”,2024 年,Llama、Mistral 等开源模型以惊人的速度逼近甚至超越闭源标杆,DeepSeek、通义千问、智谱等中国团队以 “开源彻底性” 和 “成本革命” 撼动全球格局,HuggingFace、GitHub 等平台汇聚数十万开发者,让协作与共享成为技术民主化的基石。开源,不仅是代码的开放,更是一种技术信仰的重构——它让创新从实验室走向街头巷尾,从巨头垄断转向全民共创。
但是,技术的狂飙突进也带来前所未有的挑战。性能趋同的背后,是基准测试的失效与数据污染的隐忧;开源模型的低成本与高可用性,掀起了全球 AI 价格战的腥风血雨;英伟达的芯片霸权与欧盟的严苛监管,折射出技术与权力的复杂纠葛;合成数据的滥用、深度伪造的泛滥,则让伦理与安全的警钟长鸣。我们不禁要问:当 AI 的能力逼近人类,我们是否做好了与之共存的准备?
为了优化读者体验,本章编者没有采用传统的新闻条列方式,而是综合了多份国内外报告及长文的内容,融合全球视野与本土洞察,从技术突破、商业激战、政策博弈到伦理反思,层层剖析这个时代的矛盾与希望。您将会看到:
开源如何打破技术垄断,让 Llama 3 与 GPT4o 在性能榜单上短兵相接;
轻量化与多模态为何成为 AI 落地的关键密码;
具身智能与 AI Agent 怎样重新定义人机协作的边界;
中国开源 AI 力量如何利用价格战与彻底开源“突出重围”。
站在 2025 年的门前,AI 技术正处于开源拐点,未来的行业领导者将是那些能够在开源与商业化之间找到最佳平衡的企业。通过拥抱开源,AI 技术有望更快地扩展应用场景,同时推动整个行业走向更开放和包容的未来。我们或许比任何时候都更需要清醒:开源 AI 的星辰大海,不应是少数巨头的修罗场,而应是所有人共建共享的智慧共同体。
愿这份报告成为一盏灯,点亮技术洪流中的理性与温度。
05
大事记篇
在编写今年的开源大事记的过程中,我们不断深切的感受到:开源 & AI,作为数字时代的创新引擎,正以前所未有的速度重塑全球技术格局。2024 年的开源大事记,既记录了中国开源力量的崛起,也聚焦国际开源生态的剧变——因为每一个全球性技术突破、每一次开源治理的范式转移,都与中国开源社区的未来息息相关。
由于章节重构的原因,我们今年的开源大事记,主要是梳理人工智能技术发展之外的大事,在 AI 之外,2024 年的开源世界也同样精彩,我们总结出以下特点:
开源技术突飞猛进:国产编程语言层出不穷、国产 AI 与大数据领域的进展令人惊喜、RISCV 芯片规模化落地,开源定义技术前沿。
安全风险触目惊心:XZ 后门潜伏三年、国家级供应链攻击频发,开源防线面临终极考验。
社区生态风波不断:Linux 内核驱逐俄籍贡献者、Redis 许可证变更引分叉,信任危机撕裂协作根基。
地缘博弈愈演愈烈:美国 AI 芯片出口管制、欧盟开源合规立法,技术主权争夺战白热化。
开源治理范式升级:中国最高法首判 GPL 效力、Redis 分叉 Valkey 崛起,规则重构决定生态未来。
开源教育百花齐放:百校开设开源课程、千万行代码实战育人,人才造血机制全面激活。
开源政策重塑格局:国家与各省市专项政策落地、全球合规框架角力,开源成数字经济战略必争之地。
这份报告不仅是记录,更试图揭示趋势:当 AI 开始编写代码、当地缘政治切割技术生态、当法律判决定义开源边界,我们正站在开源发展史的关键转折点。期待这份汇聚技术突破、安全警示、商业探索与政策思辨的《开源大事记》,能为中国开源参与者提供穿越变革的航标——因为明天的开源规则,将由今天的实践者共同书写!
《2024 中国开源年度报告》的编制,一如既往,受到了众多开源界朋友、媒体和开源社志愿者的大力支持。在此向所有参与报告制作的人员表示诚挚的感谢!感谢你们为中国开源贡献出自己的一份力量。
感谢协作开源社区/单位
开源社
OpenDigger/X-lab
飞致云
KWDB
Gitee
感谢合作媒体
CSDN
思否
感谢编写团队
【召集人】:王伟
【卷首语】:江波
【问卷篇】:赵思嘉
【数据篇】:方蕴仪、游明东、赵思嘉、黄帆、赵生宇、彭佳恒、夏倍蓓、夏小雅、王婕、韩凡宇、娄泽华、王衍童、李鸿斌、史雪涛、毕枫林、黄温瑞、谢思怡、朱志炜、何德鑫
【商业化篇】:袁滚滚、徐至行、刘景媛、丁宁、刘超
【开源人工智能篇】:刘天栋、庄表伟、赵生宇
【大事记篇】:袁滚滚、INP、王峰、庄表伟、卫剑钒、梁尧、李明康
【报告汇总/编辑】:赵思嘉、刘天栋
【基础设施支持】:丁文昊
【设计/排版】:王军
💡 报告全文
获取完整报告请扫描以下二维码,如遇微信拦截可复制链接到浏览器打开。
全文链接:https://kaiyuanshe.github.io/2024-China-Open-Source-Report/
红包封面
作者 | 开源社
编辑丨王军
相关阅读 | Related Reading
【龙年大礼】| 2023中国开源年度报告!
金兔迎福报、新春第一炮【2022 中国开源年度报告】!
开源社简介
开源社(英文名称为“KAIYUANSHE”)成立于 2014 年,是由志愿贡献于开源事业的个人志愿者,依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念,以 “立足中国、贡献全球,推动开源成为新时代的生活方式” 为愿景,以 “开源治理、国际接轨、社区发展、项目孵化” 为使命,旨在共创健康可持续发展的开源生态体系。
开源社积极与支持开源的社区、高校、企业以及政府相关单位紧密合作,同时也是全球开源协议认证组织 - OSI 在中国的首个成员。
自2016年起连续举办中国开源年会(COSCon),持续发布《中国开源年度报告》,联合发起了“中国开源先锋榜”、“中国开源码力榜”等,在海内外产生了广泛的影响力。