全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
科大讯飞:AI学习机等产品预计于5月6日进行产品级发布
go
lg
...
,太平洋证券曹佩。 对于公司在认知智能
大
模型
方面的规划如何?公司表示,结合讯飞多年来在深度学习算法、知识图谱、多模态感知、行业大数据等方面的优势积累,去年12月份我们进一步启动预训练
大
模型
“1+N”任务攻关,“1”是通用认知智能
大
模型
算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用
大
模型
版本。讯飞AI学习机、讯飞听见等产品将成为该项技术率先落地的产品,并于2023年5月6日进行产品级发布。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-03-16
科大讯飞:3月15日接受机构调研,人保养老、民生证券等多家机构参与
go
lg
...
。 具体内容如下: 问:公司在认知智能
大
模型
方面的规划如何? 答:结合讯飞多年来在深度学习算法、知识图谱、多模态感知、行业大数据等方面的优势积累,去年12月份我们进一步启动预训练
大
模型
“1+N”任务攻关,“1”是通用认知智能
大
模型
算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用
大
模型
版本。讯飞I学习机、讯飞听见等产品将成为该项技术率先落地的产品,并于2023年5月6日进行产品级发布。 问:个性化学习手册业务目前覆盖了多少学校,整体进展如何? 答:到2022年底,个性化学习手册已经在1400所学校商业化运营,2023年预计新增校600所,营收增长目标38%。此外,单校运营质量持续提升,续购率提升至22年的91%,付费转化率超过70%,成熟运营校的产值提升16%。 问:学习机23年预计增长如何? 答:学习机22年营收同比增长53%,23年预计增长同比更快。今年2月6日,I学习机T20Pro全新升级上市,为3-8岁、8-12岁、12-18岁的孩子分别匹配启蒙益智精准学、自主辅学精准学、学业提升精准学,通过环环相扣的“个性特征识别-自主闭环学习-真实效果反馈”三大模块帮助孩子减轻学业负担、提升学业水平,实现闭环且螺旋上升的自主学习。I学习机T20Pro上市后,2月份在全行业所有上市新品中销售额最高,获得京东2月全月单品销售额冠军、天猫2月全月新品销售额冠军(数据来源京东商智和天猫生意参谋)。此外,科大讯飞I学习机将成为认知智能
大
模型
技术率先落地的产品,预计于2023年5月6日进行产品级发布。 问:讯飞开放平台面向开发者能力授权整体情况如何? 答:讯飞I开放平台开发者生态持续保持良性发展。开发者规模22年突破380万,22年技术授权及开发者服务收入保持稳定增长,毛利同比增长20%。 问:讯飞数字政府业务有哪些进展,如何看待其未来增长? 答:22年10月,国务院办公厅发布《全国一体化政务数据建设指南》,一体化在全国呈现普遍强烈需求,各地加快推进全省一体化数字政府建设。23年2月,中共中央、国务院印发《数字中国建设整体布局规划》,提到“发展高效协同的数字政务,促进信息系统网络互联互通、数据按需共享、业务高效协同。”讯飞以5.5亿中标的安徽“全省一体化数据基础平台”项目,建成以后会成为5级应用省市县乡村联动的政务应用,后续省、市、区县三级平台建设还有进一步空间,成为推动数据全面统一、数据充分共享、数据要素开发的关键底层平台,打造出全国先进标杆和领先样板,从省内逐步向省外复制。 问:公司智能汽车业务的发展情况? 答:1、随着新能源车的逐步普及,市场渗透率会进一步加大。新能源汽车相对于传统燃油车对智能语音等多模态交互提出了更高的要求,除了少数低端代步车型外,智能语音交互功能已经成为基本配置。2、在产品布局上,从语音交互到智能座舱到智能音效,智能汽车产品不断丰富,单车价值不断提升。讯飞智能音效经车企第三方优选竞品车盲测,盲听效果超越百万豪车。讯飞智能音效在一汽、上汽、广汽等汽车厂商已有多款车型完成了定点。3、中国当前已成为全球最大的新能源汽车市场,汽车出口总量持续增长,未来新能源汽车将成为国内新能源出海的关键驱动力。讯飞多语种技术全球领先,将助力中国汽车出海。 科大讯飞(002230)主营业务:语音支撑软件、行业应用产品/系统、信息工程和运维服务等。 科大讯飞2022三季报显示,公司主营收入126.61亿元,同比上升16.5%;归母净利润4.2亿元,同比下降42.34%;扣非净利润4.27亿元,同比下降17.04%;其中2022年第三季度,公司单季度主营收入46.38亿元,同比上升1.95%;单季度归母净利润1.42亿元,同比下降54.17%;单季度扣非净利润1.48亿元,同比下降51.54%;负债率46.28%,投资收益302.62万元,财务费用-6163.24万元,毛利率40.18%。 该股最近90天内共有20家机构给出评级,买入评级19家,增持评级1家;过去90天内机构目标均价为54.07。 以下是详细的盈利预测信息: 融资融券数据显示该股近3个月融资净流入7.22亿,融资余额增加;融券净流入4.16亿,融券余额增加。根据近五年财报数据,证券之星估值分析工具显示,科大讯飞(002230)行业内竞争力的护城河良好,盈利能力一般,营收成长性良好。财务相对健康,须关注的财务指标包括:应收账款/利润率。该股好公司指标3.5星,好价格指标1.5星,综合指标2.5星。(指标仅供参考,指标范围:0 ~ 5星,最高5星) 以上内容由证券之星根据公开信息整理,与本站立场无关。证券之星力求但不保证该信息(包括但不限于文字、视频、音频、数据及图表)全部或者部分内容的的准确性、完整性、有效性、及时性等,如存在问题请联系我们。本文为数据整理,不对您构成任何投资建议,投资有风险,请谨慎决策。
lg
...
证券之星
2023-03-16
美股收盘:道指跌近300点 银行股继续下挫瑞士信贷跌14%
go
lg
...
重金投资的OpenAI公布多模态预训练
大
模型
GPT-4,文本处理能力提升至2.5万字,并增加了识别和理解图像的能力。微软也同时宣布,公司旗下的Bing聊天机器人已升级使用GPT-4技术。非常有趣的是,微软在AI领域的竞争对手谷歌也在周二出招。谷歌宣布将对其Workspace进行全面更新,Gmail、谷歌文档、表格、会议、幻灯片等等生产力软件中都将嵌入其人工智能模型。目前这些功能尚未对大众开放,仅适用于谷歌所谓的受信任的测试人员。 两家沙特航空公司计划购买逾120架波音787梦想飞机 波音与沙特阿拉伯航空公司周二宣布,沙特航空将订购39架787梦想飞机,涉及787-9和787-10两种机型,该订单还包括另外10架飞机的购买意向。同时沙特刚刚成立的利雅得航空宣布将购买39架787-9,以及另外33架飞机的购买意向。根据波音周二公布的数据,该公司上个月向客户交付了28架新飞机,远低于竞争对手空客的46架。 优步和Lyft在加州胜诉,获德银上调目标价 德银分析师Benjamin Black 将优步的目标价从42美元上调至44美元,并保持“买入”评级。该分析师还将Lyft的目标价从11美元上调至12美元,并保持“持有”评级。美国加州一家上诉法院当地时间3月13日推翻下级法院的裁决,认定优步和Lyft有权将其驾驶员视为独立承包商。 响应韩国政府计划,三星电子将向本土半导体产业投资2300亿美元 对于韩国政府提出的“打造全球最大的半导体制造基地”蓝图,三星电子周三证实,将在2042年前投资近300万亿韩元(折2300亿美元),推动韩国芯片产业的发展。根据韩国工业部的一份声明,三星将在韩国国内新建5座半导体工厂,并吸引首尔附近多达150家材料、零部件和设备制造商、无晶圆厂芯片制造商和半导体研发机构。 小鹏汽车完成营销体系改革:全国销售大区制转为小区制,汽贸与UDS团队合并重组 小鹏汽车营销体系日前已完成变革。在内部组织管理结构上,汽贸和UDS两个渠道团队完成合并;销售体系上,全国两大渠道的销售大区撤除,调整为小区制。截至发稿,小鹏汽车暂无回应。小鹏汽车在终端网络上采用的自建直营和授权经销商加盟的混合模式。这在早期帮助小鹏汽车迅速铺开门店数量,减轻建店成本压力。
lg
...
金融界
2023-03-16
万字详解 OpenAI 发布的 GPT-4
go
lg
...
安全性的顾虑开始怀疑,这种非常不开放的
大
模型
真的会一直站在巅峰么?永远都没有挑战者么? 目前在语言
大
模型
领域,Openai 的 GPT-4 无疑是最强的,但是未来呢?会不会出现一个类似在 AI 绘画领域的 stable diffusion 来打破这个垄断的局面?让我们在接下来的一年里拭目以待。 来源:金色财经
lg
...
金色财经
2023-03-15
GPT-4问世——A股掘金AI概念股
go
lg
...
生成式AI产品“文心一言”以及基于文心
大
模型
推出的生成式对话产品。此前百度曾透露,首批有400多家公司加入文心一言生态伙伴圈,此后先后有志邦家居(603801.SH)、科创信息(300730.SZ)、新晨科技(300542.SZ)、恒生电子(600570.SH)等数十家A股公司宣布接入文心一言。 在二月份ChatGPT爆火时,部分个股如汉王科技(002362.SZ)、海天瑞声(688787.SH)走出了翻倍行情,海天瑞声最高涨幅超过三倍。目前具体业务进展较快的有汤姆猫。该公司3月9日接受机构调研时介绍,该公司产品已经接入ChatGPT本体模型API开展的智能语音互动产品功能原型测试。3月14日,汤姆猫更是在该公司官方微信号“金科汤姆猫官方”正式宣布自当天下午6点起接受个人用户对“会聊天汤姆猫”产品功能原型封闭测试的资格申请。值得强调的是,此次官宣内容是一次针对现有开发中的智能语音交互产品所开展的功能原型测试。 据公开资料显示,汤姆猫系列移动应用产品累计下载量超过200亿人次,全球月活跃用户数超过4亿人次,其中超过80%的活跃用户数来自于海外市场。全球庞大的用户基数和经验丰富的海内外技术团队将成为汤姆猫未来尝试接入除文本之外,包括语音、图像、动作等多种
大
模型
的核心基石。此外,GPT-4的推出也将有助于完善公司的整体布局和应用,不断拓展公司业务和技术边界。
lg
...
证券之星
2023-03-15
OpenAI推出GPT-4!可以解析文本和图像输入 券商:商业化应用将进一步加速,背后有四大投资新路径
go
lg
...
。 据悉,GPT-4是新一代多模态
大
模型
,支持图像和文本输入以及正确的文本输出,拥有强大的识图能力,文字输入限制提升至2.5万字,支持多个语言,回答准确性显著提高,从而让新的ChatGPT更聪明。此外,GPT-4还开放了角色扮演和性格定制能力。另外,GPT-4版本还会随着时间进行自动更新。 据OpenAI介绍,GPT-4在各种专业学术基准上有着人类水平表现。根据官方实验表明,GPT-4在各种专业测试和学术基准上的表现与人类水平相当。 首先,在美国BAR律师执照统考模拟中,GPT-4得分约为前10%——击败了90%人类,而ChatGPT背后的GPT-3.5得分约为倒数10%;生物奥林匹克竞赛,GPT-3.5能达到后31%水平分位,GPT-4可达到前1%水平分位;研究生入学考试 (GRE) 、SAT数学考试成绩中,也有大幅提升,击败了80%以上的人类答题水平,而医学知识自测考试准确率达75%。 第二个测试是与其他英文机器学习模型的技术能力。研究团队使用微软Azure Translate,将MMLU 基准——一套涵盖57个主题、14000个多项选择题翻译成多种语言。在测试的英语、拉脱维亚语、威尔士语和斯瓦希里语等26种语言中,有24种语言下,GPT-4优于GPT-3.5 和其他大语言模型(Chinchilla、PaLM)的英语语言性能。 华泰证券表示,GPT-4 的核心升级点包括:1)能够处理复杂的长文本,准确性显著提升;2)接受文本和图像的输入;3)风格多样化,创造力强。建议关注应用落地方向包括:1)对话机器人:利用GPT-4 的提升交互能力,如社交与教育应用、直播、游戏等;2)搜索:借助GPT-4 的分析能力,总结生成建议,如导购平台、搜索引擎等;3)办公:引领B 端生产力变革,如营销文本等;4)开放内容创作:如小说创作。 中信证券认为,伴随成本下降以及多模态的持续演进,GPT等
大
模型
有望构筑AIGC核心基石,推动AI商业化进程加速和市场天花板打开。建议持续关注相关领域的AI公司:1)应用层;2)基础设施层。 1、ChatGPT通过大模型突破AI瓶颈,GPT-4多模态应用带动商业化加速 ChatGPT凭借大算力、大规模数据训练、基于人类知识的强化学习等方式突破AI技术瓶颈,获得超预期的用户体验效果与市场反响。回顾GPT系列模型演进,GPT-1结合无监督预训练与有监督微调过程,GPT-2突出零样本设定,GPT-3强调上下文学习能力,参数量、训练数据量不断提升。我们预计即将推出的GPT-4或支持多模态应用,开启通往人工通用智能(AGI)之路,并有望控制训练成本,降低使用门槛。目前,ChatGPT已在C端推出ChatGPT Plus订阅计划,B端开放ChatGPT API,且成本降低为0.002美金/1000token,海外多个应用率先接入。我们预计在GPT-4带动下,未来
大
模型
以及多模态模型的商业化应用将进一步加速,带动行业景气度持续向上。 2、Transformer架构支撑GPT走向多模态,构筑AIGC领域核心基石 GPT系列模型使用Transformer架构,当前基于Transformer的多模态研究为AI领域研究热点,Transformer已开始打破NLP与CV领域壁垒,有望支撑GPT系列模型走向多模态应用,构筑AIGC领域核心能力基石。我们梳理出GPT的潜在基础能力包括文本生成(分析)、代码生成、对话交互、机器翻译、图像生成、视频生成等。我们认为,前述基础能力将支撑GPT系列模型在通用与垂直领域的应用,典型应用场景如:通用领域—搜索引擎/办公软件,垂直领域—教育/金融/医疗/图像视频等。 3、通用与垂直场景多点开花,GPT变革内容生成与交互方式 GPT有望革新各行各业的内容生成与交互方式。基于GPT+文本&代码&对话&翻译&图像&视频,我们看好GPT类技术未来在通用与垂直场景的应用空间。例如,搜索引擎结合GPT将重塑搜索结果呈现方式,多模态的引入带来一站式的文本、图像、视频汇集结果,将大为提升用户信息收集效率。 中金公司机构以下四大环节有望迎来新机遇: (1)算力方面,ChatGPT训练所耗费的算力大约为3640 PF-days,即假设每秒运算一千万亿次,需要连续运行3640天,训练
大
模型
需要强大的算力。人工智能的跨越式发展将成为算力流量消耗的重要驱动力,未来数据中心和相关的配套产业有望实现更好增长。其中,数据中心建设有四大重点方向: ①第三方IDC运营环节:宝信软件、数据港(与阿里合作)、科华恒盛(与腾讯合作)、奥飞数据、美利云、光环新网、铜牛信息等。 ②储能温控环节:英维克(互联网IDC空调龙头)、佳力图(绑定中国移动)、高澜股份、依米康、申菱环境、朗进科技、科华数据、润泽科技等。 ③传输网设备、光纤光缆、光模块等ICT环节:光模块领域的新易盛、中际旭创、博创科技;光器件领域的天孚通信、腾景科技、光库科技;光纤光缆领域的中天科技、亨通光电等。 ④高性能计算芯片板块:澜起科技、国芯科技、聚辰股份、兆易创新、景嘉微、寒武纪、芯原股份等。 (2)数据标注方面,ChatGPT的训练过程加大了人工标注的力度和精度,这代表着在未来的人工智能领域,优质的数据源和强大的标注能力,将成为行业的基础设施。 (3)NLP(自然语言处理)方面,安信证券表示,由于ChatGPT主要基于自然语言处理,因此在NLP领域沉淀较多的企业,有望率先实现功能的部分复现,NLP头部厂商将率先受益。 (4)AIGC(人工智能生成内容)方面,ChatGPT是AIGC应用的又一个起点,随着深度学习模型不断完善、开源模式的推动、
大
模型
探索商业化的可能,AIGC有望加速发展。
lg
...
金融界
2023-03-15
海天瑞声:ChatGPT代表的
大
模型
带来AI产业新变革,将持续、密切关注发展趋势
go
lg
...
复投资者提问时表示,无论是传统模型还是
大
模型
的迭代、发展都依赖高质量的数据供给。 以OpenAI研发的ChatGPT为代表的
大
模型
带来了AI产业的新变革,在诸如强化学习以及垂向场景拓展方向预期将会产生新的增量数据需求。 公司将会持续、密切关注该领域的发展趋势,积极跟进和对接境内外产业链上各类客户的新需求,并适时推进公司标准化数据集产品创新、技术创新,力争持续满足相关客户的数据需求。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-03-15
海光信息:海光DCU协处理器可广泛用于计算密集类应用领域
go
lg
...
台回复投资者,AI算力是ChatGPT
大
模型
训练与产品运营核心基础设施,
大
模型
的快速发展或将进一步促进行业的繁荣。 海光DCU协处理器主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务,可广泛应用于大数据处理、人工智能、商业计算等计算密集类应用领域。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-03-15
OpenAI正式推出多模态GPT-4
go
lg
...
我们首个训练性能可以进行提前准确预测的
大
模型
。随着我们继续专注于可靠扩展,中级目标是磨方法,以帮助OpenAI能够持续提前预测未来,并且为未来做好准备,我们认为这一点,对安全至关重要。 我们正在通过ChatGPT和API(您可以加入WaitList)发布GPT-4的文本输入功能,为了能够更大范围地提供图像输入功能,我们正在与合作伙伴紧密合作,以形成一个不错的开端。我们计划开源OpenAI Evals,也是我们自动评估AI模型性能的框架,任何人都可以提出我们模型中的不足之处,以帮助它的进一步的改进。 能力 在简单闲聊时,也许不太好发现GPT-3.5和GPT-4之间的区别。但是,当任务的复杂性达到足够的阈值时,它们的区别就出来了。具体来说,GPT-4比GPT-3.5更可靠,更有创造力,能够处理更细微的指令。 为了理解这两个模型之间的差异,我们在各种不同的基准上进行了测试,包括模拟最开始那些为人类设计的考试。通过使用最新的公开测试(就奥数和AP等等考试)还包括购买2022-2023年版的练习考试来进行,我们没有为这类考试给模型做专门的培训,当然,考试中存在很少的问题是模型在训练过程中存在的,但我们认为下列结果是有代表性的。 我们还在为机器学习模型设计的传统基准上,对GPT-4进行了评估。GPT-4大大超过现有的大语言模型,与多数最先进的(SOTA)模型并驾齐驱,这些模型包括针对基准的制作或额外的训练协议。 由于现有的大多数ML基准是用英语编写的,为了初步了解其他语言的能力,我们使用Azure Translate将MMLU基准:一套涵盖57个主题的14000个选择题,翻译成了各种语言。在测试的26种语言中的24种语言中,GPT-4的表现优于GPT-3.5和其他
大
模型
(Chinchilla,PaLM)的英语表现,这种优秀表现还包括类似拉脱维亚语、威尔士语和斯瓦希里语等等。 我们一直在内部使用GPT-4,发现它对支持、销售、内容审核和编程等功能会产生很大影响,我们还在用它来协助人类评估AI的输出,这就是我们调整战略的第二阶段的开始。 视觉输入 GPT-4可以接受文本和图像的提示语(prompt),这与纯文本设置平行。比如说,可以让用户指定任何视觉或语言任务,它可以生成文本输出(自然语言、代码等),给定的输入包括带有文字和照片的文件、图表或屏幕截图,GPT-4表现出与纯文本输入类似的能力。此外,还可以应用在为纯文本语言模型开发的测试时间技术,包括少数几个镜头和CoT的Prompting,不过目前图像输入仍然属于研究方面预览,没有像C端公开产品。 下列图片显示了一个 "Lightning Cable "适配器的包装,有三个面板。 面板1:一个带有VGA接口(通常用于电脑显示器的大型蓝色15针接口)的智能手机插在其充电端口。 面板2:"Lightning Cable "适配器的包装上有一张VGA接口的图片。 面板3:VGA连接器的特写,末端是一个小的Lightning连接器(用于为iPhone和其他苹果设备充电)。 这张图片的搞笑性质来自于将一个大的、过时的VGA连接器插入一个小的、现代的智能手机充电端口..因此看起来很荒谬 通过在一套狭窄的标准学术视觉基准上,对GPT-4的性能进行评估,并且对它进行预览。然而,这些数字并不能代表其的能力范围,因为我们发现,这个模型能够处理很多的新的和令人兴奋的任务,OpenAI计划很快发布进一步的分析和评估数字,以及对测试时间技术效果的彻底调查结果。 可控制的AI 我们一直在努力实现关于定义AI行为那篇文章中,所概述的计划的每个方面,包括AI的可控制性。与经典的ChatGPT个性的固定言语、语气和风格不同,开发者(很快就是所有的ChatGPT用户)现在可以通过在 "系统 "消息中描述这些方向,来规定自己的AI的风格和任务。系统消息允许API用户在范围内,大幅对用户体验进行定制,我们将持续改进。 局限性 尽管能力惊人,不过,GPT-4仍存在与早期GPT模型类似的限制。最重要的是,它仍然不是完全可靠的(比如说,它会对事实产生 "幻觉",并出现推理错误)。在使用语言模型的输出时,特别是在高风险的情况下,应该非常小心谨慎,比如说:需要人类审查,完全避免高风险的使用)以及需要与特定的使用案例的需求相匹配。 尽管各类情况仍然存在,但相较于以前的模型(这些模型本身也在不断改进),GPT-4大大减少了hallucinations(意思是网络错觉,这里指的是一本正经的胡说八道)。在我们内部的对抗性事实性评估中,GPT-4的得分比我们最新推出的GPT-3.5高40%。 可控制的AI GPT-4的基础模型在这项任务中只比GPT-3.5略胜一筹;然而,在经过RLHF的后期训练后(应用我们对GPT-3.5使用的相同过程),却有很大差距。该模型在其输出中会有各种偏差,我们在这些方面已经取得了进展,但仍有更多工作要做。根据我们最近的博文,我们的目标是使我们建立的人工智能系统具有合理的默认行为,以反映广泛的用户价值观,允许这些系统在广泛的范围内被定制,并获得公众对这些范围的意见。 GPT-4通常缺乏对其绝大部分数据截止后(2021年9月)发生的事件的了解,也不会从其经验中学习。它有时会犯一些简单的推理错误,这似乎与这么多领域的能力不相符,或者过于轻信用户的明显虚假陈述。有时它也会像人类一样在困难的问题上失败,例如在它产生的代码中引入安全漏洞。GPT-4也可能在预测中自信地犯错。 风险和缓解措施 我们一直在对GPT-4进行迭代,使其从训练开始就更加安全,保持一致性,我们所做的努力包括预训练数据的选择和过滤、评估,邀请专家参与,对模型安全改进、监测,以及执行。 GPT-4与过去的模型会存在类似风险,如生产有害的建议、错误代码或不准确的信息。然而,GPT-4的额外能力还导致了新的风险面。为了明确这些风险的具体情况,我们聘请了50多位来自人工智能对接风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家对该模型进行对抗性测试。他们的参与,使我们能够测试模型在高风险领域的行为,这些领域需要专业知识来评估。来自这些领域专家的反馈和数据,为我们缓解和改进模型提供了依据。比如说,我们已经收集了额外的数据,以提高GPT-4拒绝有关如何合成危险化学品的请求的能力。 GPT-4在RLHF训练中加入了一个额外的安全奖励信号,通过训练模型来拒绝对此类内容的请求,从而减少有害产出(由我们的使用指南定义)。奖励是由GPT-4的分类器提供的,它能够判断安全边界和安全相关提示的完成方式。为了防止模型拒绝有效的请求,我们从不同的来源(例如,标记的生产数据,人类的红队,模型生成的提示)收集多样化的数据集,并在允许和不允许的类别上应用安全奖励信号(存在正值或负值)。 与GPT-3.5相比,我们的缓解措施大大改善了GPT-4的许多安全性能。与GPT-3.5相比,我们将模型对非法内容的请求的响应倾向,降低了82%,而GPT-4对敏感请求(如医疗建议和自我伤害)的响应符合我们的政策的频率提高了29% 总的来说,我们的模型级干预措施增加了诱发不良行为的难度,但仍然存在 "越狱 "的情况,以产生违反我们使用指南的内容。随着人工智能系统的 风险的增加,在这些干预措施中实现极高的可靠性将变得至关重要。目前重要的是,用部署时间的安全技术来补充这些限制,如想办法监测。 GPT-4和后续模型,很有可能对社会产生正面或者负面的影响,我们正在与外部研究人员合作,以改善我们对潜在影响的理解和评估,以及建立对未来系统中可能出现的危险能力的评估。我们将很快分享我们对GPT-4和其他人工智能系统的潜在社会和经济影响的更多思考。 训练过程 和之前的GPT模型一样,GPT-4基础模型的训练是为了预测文档中的下一个单词,并使用公开的数据(如互联网数据)以及我们授权的数据进行训练。这些数据是来自于极大规模的语料库,包括数学问题的正确和错误的解决方案,弱的和强的推理,自相矛盾的和一致的声明,以及种类繁多的意识形态和想法。 因此,当被提示有一个问题时,基础模型可以以各种各样的方式作出反应,而这些反应可能与用户的意图相去甚远。为了使其与用户的意图保持一致,我们使用人类反馈的强化学习(RLHF)对模型的行为进行微调。 注意,模型的能力似乎主要来自于预训练过程,RLHF并不能提高考试成绩(如果不主动努力,它实际上会降低考试成绩)。但是对模型的引导来自于训练后的过程--基础模型需要及时的工程,甚至知道它应该回答问题。 可预测的扩展 GPT-4项目的一大重点是建立一个可预测扩展的深度学习栈。主要原因是,对于像GPT-4这样非常大的训练运行,做大量的特定模型调整是不可行的。我们对基础设施进行了开发和优化,在多种规模下都有非常可预测的行为。为了验证这种可扩展性,我们提前准确地预测了GPT-4在我们内部代码库(不属于训练集)中的最终损失,方法是通过使用相同的方法训练的模型进行推断,但使用的计算量要少10000倍。 我们认为,准确预测未来的机器学习能力是安全的一个重要部分,相对于其潜在的影响,它没有得到足够的重视(尽管我们已经被几个机构的努力所鼓舞)。我们正在扩大我们的努力,开发一些方法,为社会提供更好的指导,让人们了解对未来系统的期望,我们希望这成为该领域的一个共同目标。 开放式人工智能评估 我们正在开源OpenAI Evals,这是我们的软件框架,用于创建和运行评估GPT-4等模型的基准,同时逐个样本检查其性能。我们使用Evals来指导我们模型的开发(包括识别缺点和防止退步),我们的用户可以应用它来跟踪不同模型版本(现在将定期推出)和不断发展的产品集成的性能。例如,Stripe已经使用Evals来补充他们的人工评估,以衡量他们的GPT驱动的文档工具的准确性。 因为代码都是开源的,Evals支持编写新的类来实现自定义的评估逻辑。然而,根据我们自己的经验,许多基准都遵循一些 "模板 "中的一个,所以我们也包括了内部最有用的模板(包括一个 "模型分级Evals "的模板--我们发现GPT-4有令人惊讶的能力来检查自己的工作)。一般来说,建立一个新的评估的最有效方法是将这些模板中的一个实例化,并提供数据。我们很高兴看到其他人能用这些模板和Evals更广泛地建立什么。 我们希望Evals成为一个分享和众包基准的工具,最大限度地代表广泛的故障模式和困难任务。作为后续的例子,我们已经创建了一个逻辑谜题评估,其中包含GPT-4失败的十个提示。Evals也与实现现有的基准兼容;我们已经包括了几个实现学术基准的笔记本和一些整合CoQA(小的子集)的变化作为例子。 我们邀请大家使用Evals来测试我们的模型,并提交最有趣的例子。我们相信Evals将成为使用和建立在我们的模型之上的过程中不可或缺的一部分,我们欢迎直接贡献、问题和反馈。 ChatGPT Plus ChatGPT Plus用户将在chat.openai.com上获得有使用上限的GPT-4权限。我们将根据实际需求和系统性能调整确切的使用上限,但我们预计容量将受到严重限制(尽管我们将在接下来的几个月里扩大和优化)。 根据我们看到的流量模式,我们可能会为更高的GPT-4使用量引入一个新的订阅级别,我们也希望在某个时候提供一定数量的免费GPT-4查询,这样那些没有订阅的用户也可以尝试。 API 要获得GPT-4的API(使用与gpt-3.5-turbo相同的ChatCompletions API),请可以去OpenAI的官方Waitlist上注册。 结论 我们期待着GPT-4成为一个有价值的工具,通过为许多应用提供动力来改善人们的生活。还有很多工作要做,我们期待着通过社区的集体努力,在这个模型的基础上进行建设、探索和贡献,共同对模型进行改进。 参考文献:1.https://openai.com/research/gpt-4 2.https://techcrunch.com/2023/03/14/openai-releases-gpt-4-ai-that-it-claims-is-state-of-the-art/ 3.https://www.theverge.com/2023/3/14/23638033/openai-gpt-4-chatgpt-multimodal-deep-learning 来源:金色财经
lg
...
金色财经
2023-03-15
OpenAI发布GPT-4模型,人工智能ETF(159819)高开现涨0.97%
go
lg
...
日凌晨,OpenAI发布了多模态预训练
大
模型
GPT-4。GPT-4实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至2.5万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。实验表明,GPT-4在各种专业测试和学术基准上的表现优良,例如,它通过了模拟律师考试,且分数在应试者的前10%左右。 国盛证券认为,ChatGPT发展需要持续大量数据投喂,ChatGPT数据主线逻辑加强。一方面,GPT4.0的推出势必需要更大量数据训练,另一方面国内发展独立自主的类ChatGPT产品也需要足够数据训练支持,且想在短时间内缩短与海外产品差距,大量优质数据投喂支持是必要条件,有数据版权的企业的数据价值将显著提升。 (来源:界面AI) 声明:本条内容由界面AI生成并授权使用,内容仅供参考,不构成投资建议。AI技术战略支持为有连云。
lg
...
有连云
2023-03-15
上一页
1
•••
901
902
903
904
905
•••
927
下一页
24小时热点
美国“冷门”经济数据报警!特朗普或将遭遇拜登式“选情危机”
lg
...
金市展望:金价徘徊不前,白银与铂金接棒狂飙 贵金属市场酝酿新一轮行情?
lg
...
散户“地震了”?前摩根大通策略师警告:特朗普与马斯克纷争是美股回调“导火索”
lg
...
下周前瞻:CPI数据或成市场上行“绊脚石”?
lg
...
深度:马斯克“失控”惹祸上身,与特朗普决裂对特斯拉股价意味着什么?
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
34讨论
#链上风云#
lg
...
109讨论
#VIP会员尊享#
lg
...
1989讨论
#CES 2025国际消费电子展#
lg
...
21讨论