Gitee 官方博客
  • 产品动态
  • 企业案例
  • 项目推荐
  • 关于开源
  • 发现更多
  • 回到 Gitee
  • 产品动态
  • 企业案例
  • 项目推荐
  • 关于开源
  • 发现更多
  • 回到 Gitee

算法大公开!开源项目的Gitee指数是如何计算的?

Gitee
2年前发布在 产品动态

经常逛 Gitee 的同学一定会注意到,在 Gitee 上衡量一个开源项目优质与否,除了 Star 的数量以外,还有一个很重要的指标——Gitee 指数。如果该项目 Star 数量很多但 Gitee 指数较低,那么该项目可能“年久失修”或已无人维护,如果该项目 Star 数量并不多但 Gitee 指数较高,那么说明这个项目是个“潜力股”,值得持续关注。

算法大公开!开源项目的Gitee指数是如何计算的?-Gitee 官方博客

综合 Gitee 八年来的经验,我们明白想要对开源项目的质量进行合理评估,仅仅只看 Star 数量是远不够的,要想全方位地评估一个项目,就必须收集其各方面的基础数据。

在没有推荐算法的情况下,用户会通常会选择高 Star 数的项目,而忽略低 Star 数的项目,低 Star 数的项目就不值得推荐吗?根据这个问题引发了 Gitee 团队对什么是优质开源项目的探讨。最后提出了好的开源项目应该从以下角度切入(以下的数据信息和分析都是依据于真实的开源软件社区)。

Gitee 指数评估维度

1.影响力

用来判断开发者是否真正关注过该项目,低 Star 数可能是由种种原因被埋没,而长时间无 Star,可能这个项目并没有辐射到其他开发者。

2.代码活跃度

项目代码“年久失修”,维护人员可能已经抛弃了该项目,只是忘了清除仓库,这样的项目在全球范围内不在少数,但也有可能是已经较为完善的项目,不需要过多地维护。

3.社区活跃度

你对一个项目提了一个 Issue,在短时间内就得到回应,这样的感觉是极好的,反映其项目作者与社区普通用户的互动频率。

4.团队健康

这一点也相当的重要,如果项目实际的贡献者只有那么几位,关键贡献者从团队退出是经常导致一个软件的停更的原因,该指数与贡献者人数和稳定度相关。

5.流行趋势

与项目近期收到用户的关注程度相关。

有了评估维度后,就需要对各个维度进行权重划分,各维度具体的权重如下图所示:

算法大公开!开源项目的Gitee指数是如何计算的?-Gitee 官方博客

维度计算方法

有权重后就可以对不同维度进行计算了,各维度的计算方法如下:

算法大公开!开源项目的Gitee指数是如何计算的?-Gitee 官方博客

p为项目画像的维度, fi为维度下的各个分支特征,wi是基于业务场景中的经验权重。

要做到数据更加易懂及好看,还要进行特征归一化:

算法大公开!开源项目的Gitee指数是如何计算的?-Gitee 官方博客

其中x为输入的数据,min(xi)为所有数据样本中的最小值,max(xi)为所有数据样本中的最大值。

该方法能够将需要对比的数据映射到[0,1]区间中,给用户展示可对比的数据。

归一化后的项目特征如下图:

算法大公开!开源项目的Gitee指数是如何计算的?-Gitee 官方博客

最终呈现在线上的就是大家在文中最开始看到的效果了。

算法大公开!开源项目的Gitee指数是如何计算的?-Gitee 官方博客

目前占据 Gitee 指数全站排名第一的项目是来自华为的 AI 框架 MindSpore ,如果你自己项目的 Gitee 指数想要追上它,通过这次的算法大公开,相信你知道要从哪方面努力了,那就赶快行动起来吧!

同时我们也开放各位开发者对于算法的各种建议,目的就是能够最大限度的为大家提供一个科学、合理、公平的开源项目指标,如果你对该算法有什么想法,欢迎留言告诉我们哦~

Giteegitee指数算法

本文系作者 @Gitee 原创发布在 Gitee 官方博客。未经许可,禁止转载。

研发团队如何使用Gitee企业版实现敏捷开发管理
上一篇
如何更优雅地同步 Gitee 和 GitHub 的代码仓库?
下一篇
近期文章
  • 金融人怎么写出安全可靠的代码?知名证券企业这样做
  • 16家单位、2万名研发,金融科技领头羊如何集中统一代码管理?
  • 《Gitee 专业版白皮书》重磅发布,助力企业实现高效、快捷交付
  • Gitee x 未来物联:高效能产研团队是怎样炼成的?
  • 《2022 中国开源开发者报告》正式发布!
  • 开工福利:领取新人专属多重福利
  • 点击查看2022年你与Gitee的记忆
  • 我们让 ChatGPT 写了一篇开源项目推荐
  • Gitee 自动化全新上线,让提效融入每处细节
  • Gitee Scan 四大升级,助力企业完美实现质量左移
相关文章
16家单位、2万名研发,金融科技领头羊如何集中统一代码管理?
《Gitee 专业版白皮书》重磅发布,助力企业实现高效、快捷交付
点击查看2022年你与Gitee的记忆
我们让 ChatGPT 写了一篇开源项目推荐
关于我们

Gitee(gitee.com)是 OSCHINA.NET 推出的代码托管·协作开发平台,支持 Git 和 SVN,提供免费的私有仓库托管。目前已有超过 800 万的开发者选择 Gitee。

品牌内容
开源软件 GVP计划 Gitee 封面人物 CopyCat 代码克隆检测
友情链接
开源中国 Gitee Gitee 高校版 Gitee 企业版
Copyright © 2023 Gitee 官方博客. Designed by nicetheme.
  • 产品动态
  • 企业案例
  • 项目推荐
  • 关于开源
  • 发现更多
  • 回到 Gitee
热门搜索
  • Gitee
  • gitee 企业版
  • 码云
  • 开源项目
  • 码云Gitee
  • GVP
  • Git
  • 开源
  • 码云企业版
  • 码云周刊
  • 码云 gitee
  • gitee企业版
  • 内源
  • 内部开源
  • innersource
  • DevOps
  • 小程序
  • 企业版
Gitee
安全、稳定、高效的云端软件开发协作平台。
Top