钛媒体App 3月15日消息,近日,由清华技术成果转化的公司智谱AI开源了GLM系列模型的新成员——中英双语对话模型ChatGLM-6B,支持在单张消费级显卡上进行推理使用。这是继此前开源GLM-130B千亿基座模型之后,智谱AI再次推出大模型方向的研究成果。与此同时,基于千亿基座模型的ChatGLM也同期推出,初具问答和对话功能,现已开启邀请制内测(内测申请网址chatglm.cn),后续还会逐步扩大内测范围。 据悉,ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化。该模型基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的ChatGLM-6B 虽然规模不及千亿模型,但大大降低了推理成本,提升了效率,并且已经能生成相当符合人类偏好的回答。


常见问题
相关文章
猜你喜欢
- 扣上的安全带会自动打开?本田在美国召回近45万辆汽车 2023-03-20
- 对标微软!随着人工智能竞赛加剧,谷歌推出了一系列AI工具 2023-03-20
- 错过AI盛宴的三星,试图用2300亿美元“搅局” 2023-03-20
- 能进行图片交易的“Instagram”?「Imagol」为品牌和普通用户打造AI图片交易平台 2023-03-20
- 头部量化私募春季“抢人”大战白热化! 2023-03-20
- 北航和华为共同申请自动驾驶专利公布,可量化车辆行驶风险 2023-03-20
- 3月15日人福医药现2854.73万元大宗交易 2023-03-20
- AI来袭,交通智能化“提挡加速” 2023-03-20
- 燧原科技宣布升级企业战略——全面打造AIGC时代的基础设施 2023-03-20
- 专注于量化交易研发 Stash打造数字投资银行平台 2023-03-20