梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-4识图功能迟迟不开放,终于有人忍不住自己动手做了一个。MiniGPT-4来了,Demo开放在线可玩。传一张海鲜大餐照片上去,就能直接获得菜谱。传一张商品效果图,就可以让AI写一篇带货文案。手绘一个网页,可以给出对应的HTML代码除了生产力拉满,也支持根据常识推理图上内容是否合理、解释表情包为什么好笑,以及看截图找电影等娱乐玩法。可以说,GPT-4发布时展示过的功能,MiniGPT-4基本也都有了。这下网友直接把Demo服务器挤爆,开发团队连开4台备用服务器,都有几十人在排队。不等OpenAI了,现在就能玩除了研究团队给出的示例,网友也用MiniGPT-4玩出了各种花样有人上传自己画的画,让AI评价评价。有人上传一张从车道拍摄的飞机坠毁瞬间,让MiniGPT-4尽可能详细地描述,并思考自动驾驶AI能不能理解这个场面。做到这么好的效果,MiniGPT-4实现起来却并不复杂。把图像编码器与开源语言模型Vicuna(小羊驼)整合起来,并且冻结了两者的大部分参数,只需要训练很少一部分。传统预训练阶段,使用4张A100在10个小时内就可完成,此时训练出来的Vicuna已能够理解图像,但生成能力受到很大影响。为解决这个问题,团队让MiniGPT-4与ChatGPT合作创建了3500个图像文本的高质量数据集,也一并开源。用新的数据集微调可以显著提高模型的生成可靠性和整体可用性,而且计算效率很高,使用单个A100只需要7分钟。并且团队正在准备一个更轻量级的版本,部署起来只需要23GB显存。也就是消费级显卡中拥有24GB显存的3090或4090就可以本地运行了。MiniGPT-4开发团队来自KAUST(沙特阿卜杜拉国王科技大学),包括4位华人成员和他们的导师 Mohamed Elhoseiny。两位正在读博的共同一作还在GitHub页面上特别标注正在找工作。有意向的公司要抓紧抢人了~在线Demo:https://minigpt-4.github.io开源代码:https://github.com/Vision-CAIR/MiniGPT-4论文:https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf— 完 —量子位 QbitAI · 头条号签约


常见问题
相关文章
猜你喜欢
- 量化派向港交所提交上市申请,业务规模扩展迅速 2023-04-20
- 滕州市启动餐具、饮具集中消毒服务单位量化分级管理工作 2023-04-20
- 迈瑞医疗大宗交易成交1.39万股 成交额349.77万元 2023-04-20
- 光弘科技大宗交易成交689.36万元 2023-04-20
- 宁德时代大宗交易成交870.41万元 2023-04-20
- 马斯克因特斯拉自动驾驶宣传面临美国证券交易委员会调查张凯丽,终于为她的“横行霸道”付出了代价! 2023-04-20
- 马斯克因特斯拉自动驾驶宣传面临美国证券交易委员会调查张凯丽,终于为她的“横行霸道”付出了代价! 2023-04-20
- 易动力控股孙公司拟向惠州市联赢科技有限公司购买一套方形模组自动化生产线设备 交易总价为1500万学生自创“晕船字体”,比“赵今麦字体”更受欢迎,老师爱不释手 2023-04-20
- 国网辽宁电力:积极搭建“绿电”交易平台 主动服务“双碳”政策落地《狂飙》“程程”与老公秀恩爱,黄海波显沧桑,中年发福大腹便便 2023-04-20
- 14个交易日这些主动权益基涨幅亮眼,最高大涨21.15%拔火罐吸出来的瘀血,是体内的毒素?医生将实话告诉你,涨知识了 2023-04-20