大茂名网

 找回密码
 用户注册

QQ登录

只需一步,快速开始

查看: 200|回复: 0

谈谈BigCode 开源轻量级语言模型 2023/2/2 12:16:49

[复制链接]

1万

主题

1万

帖子

6万

积分

钻石元老

Rank: 24Rank: 24Rank: 24Rank: 24Rank: 24Rank: 24

积分
62908
发表于 2023-2-2 12:16 | 显示全部楼层 |阅读模式

马上注册登陆,结交更多好友,享用更多功能,让你轻松玩转社区

您需要 登录 才可以下载或查看,没有账号?用户注册

x
根据官方提供的信息,训练 SC 的基础是 T S(11)数据集,SC 虽然规模相对较小,只有 11 亿个参数,在参数的绝对数量上低于 IC(67 亿)或 CG-(27 亿),但 SC 的表现则是要远好于这些大型多语言模型。不过也正是参数远远不及 GPT-3 等参数超过千亿级别的超大型语言模型,SC 适用的编程语言范围也比较有限,仅支持 P、J 和 JS 种语言。Linux命令大全的相关知识也可以到网站具体了解一下,有专业的客服人员为您全面解读,相信会有一个好的合作!
为了照顾用户隐私和保证训练质量,在训练模型之前,BC 注释了 400 个样本,并建立和不断完善 RE 规则,以便在训练前从数据集的代码中删除诸如电子邮件地址、密钥和 IP 地址等敏感信息。 为了让开发者可以放心使用 SC 生成的代码,BC 推出了 D S 搜索工具。通过这个工具,开发者可以找出代码的来源,以便在 SC 产生的代码属于某一个项目的情况下,用户能够遵守相应的许可要求。 此外,BC 还推出了「A I T S」工具,开发者可以检查自己下的仓库是否是训练数据集的一部分,可以将自己的开源仓库从数据集中删除。 BC 目前已经在 H 中提供了 SC 演示,供任何人研究试用。
爱上大茂名,喜当大猫友,吃喝玩乐事,天天乐开怀!
您需要登录后才可以回帖 登录 | 用户注册

本版积分规则

QQ|客服:0668-2886677QQ:75281068|大茂微博|小黑屋|手机版|Archiver|大茂名网 ( 粤ICP备18149867号 )茂名市大茂科技有限公司 版权所有 

GMT+8, 2025-2-3 03:01 , Processed in 0.086857 second(s), 23 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表