当前位置:首页 > 电竞资讯 > 正文内容

中国版ChatGPT三月底开源,中国发展NLP有两大困难

杏彩体育3年前 (2023-03-18)电竞资讯423

中国版的ChatGPT要来了。

日前复旦大学计算机科学技术学院教授邱锡鹏教授透露,国内第一个对话式大型语言模型MOSS将有可能在3月底开源,在不少媒体的介绍中,复旦大学的MOSS被看作是中国版的ChatGPT。

只不过尴尬的是,从网上透露出来的内测信息来看,就算是中国顶尖大学推出的NLP模型,它回答英文问题的水平却高于中文问题,说白了,中国人做的大型语言模型,更擅长英文,而不是中文。

针对这个问题,邱锡鹏教授坦言:英文作为科研主流语言,在学术界和工业界中得到广泛应用,积累了大量高质量的语料数据,这为英文自然语言处理的研究提供了极大的优势。根据相关数据,MOSS学习的英文单词数量是中文的十倍。

必须承认,这也是国内发展NLP不得不重视的问题之一。

正如上文所说,英语作为科研主流语言,在全球范围内有着大量的学术期刊、网页、书籍,可以作为ChatGPT的训练数据来源,比如说英国人创办的《自然》杂志、《柳叶刀》等等,在ChatGPT的训练数据来源总量中,类似的杂志、期刊排名第三,尤其是专业的学术期刊,这些数据会帮助ChatGPT的写作更清晰、有条理。

除此之外,英文网站占全球网站总量近60%,而中文网站目前仍不足2%。

另外,除了中文对比英文天然存在的训练数据差距之外,还有一个很大的困难,还是计算芯片硬件上的差距。

去年8月,美国限制高性能GPU芯片出口,所有行业人士都直接指出,这是为了限制国内AI技术的发展。当时,有些人觉得这件事没那么重要,可等到OpenAI在去年年底推出ChatGPT之后,国内不少人终于认识到老美釜底抽薪的招数,有多狠辣。

我们必须要承认,高性能GPU是人工智能的基石

据称未来的ChatGPT5将会在25000个英伟达GPU上进行训练,但如果算上为了满足全球用户的计算量,谷歌、微软等搜索行业巨头可能会需要总共几十万、甚至百万台的英伟达GPU。

底层硬件的局限和差距,已经成为国内发展ChatGPT不得不重视的问题。

最后,在ChatGPT发布之前,很多人觉得中美两国在AI领域的技术积累不分伯仲、平分秋色,甚至是中国小优,可ChatGPT推出之后,不少人瞬间感觉被“打脸”,原来差距如此明显。

不得不说,我们仍要谦虚地看待国内AI技术产业的发展仍然落后国外顶尖水平。

扫描二维码推送至手机访问。

版权声明:本文由杏彩体育-专注全球体育资讯发布,如需转载请注明出处。

本文链接:http://www.redirected.net/?id=14442

分享给朋友:

“中国版ChatGPT三月底开源,中国发展NLP有两大困难” 的相关文章

“郑好办APP”回应核酸结果查询异常:模块漏洞已升级完善

  中新网郑州11月26日电 (阚力)郑州市城市综合服务平台“郑好办APP”26日晚间弹窗发布说明称,其核酸结果查询模块中“老幼助查”功能存在漏洞,已对系统进行升级完善。   26日午间,社交平台陆续有郑州网友贴出诸多虚拟人物的核酸检测结果。网友称,在“郑好办APP”核酸检测结果查...

世界杯重磅对决!2豪门捧杯5次,4冠王或爆冷出局,日本或躺赢

世界杯重磅对决!2豪门捧杯5次,4冠王或爆冷出局,日本或躺赢

11月28日凌晨3点,卡塔尔世界杯将迎来一场焦点之战,这就是E组两支夺冠热门球队的较量,排名E组第一的西班牙队将迎战排名第三的德国队,在以往的世界杯中,德国队曾经4次举起大力神杯,西班牙1次举起大力神杯,可本届世界杯结果却不太一样,德国队在本场比赛中输球,很大概率将会提前拎包回家,排名第二...

体育:热点资讯

体育:热点资讯

新浪体育:   北京时间8月25日2时45分(英国当地时间24日19时45分),欧冠附加赛次回合又赛5场,曼城主场1比0小胜布加勒斯特星,总比分6比0晋级。纳瓦斯助攻,德尔夫打进个人欧冠首球。伊赫纳乔因伤下场。 搜狐体育: 北京时间8月...

网络上有哪些直播世界杯比较清晰的网站?

本文将就网络上有哪些直播世界杯比较清晰的网站进行介绍。 1:直播世界杯的网站 1.ESPN 2.天空体育 3.beIN体育 4.福克斯体育...

快讯:《体育场馆照明设计及检测标准》JGJ 153-2016发行

        新版本的《体育场馆照明设计及检测标准》即将实施,住房城乡建设部已经批准,并发布公告,《体育场馆照明设计及检测标准》JGJ153-2016自2017年6月1日起实施。标准中的第4.4.11、4.4.12条为强制性条文,必须严格执行。&n...

喜讯!达观数据签约知名全媒体新闻资讯平台澎湃新闻

喜讯!达观数据签约知名全媒体新闻资讯平台澎湃新闻

达观数据签约上海知名的全媒体新闻资讯平台——澎湃新闻,为其提供个性化推荐等内容智能分发产品,让澎湃新闻的优质内容实现千人千面的分发效果。关于澎湃新闻澎湃新闻诞生于2014年,是...