全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
OpenAI正式推出多模态GPT-4
go
lg
...
杂的图像进行说明和解释,比如说,从插入
iPhone
的图片中识别出一个Lightning Cable适配器(下文有图片)。 图像理解能力还没有向所有OpenAI的客户开发,OpenAI正在与合作伙伴Be My Eyes进行测试。 OpenAI承认,GPT-4并不完美,仍然会对事实验证的问题产生错乱感,也会犯一些推理错误,偶尔过度自信。 开源OpenAI Evals,用于创建和运行评估GPT-4等模型的基准,同时逐个样本检查其性能。 官宣文档 OpenAI已经正式推出GPT-4,这也是OpenAI在扩大深度学习方面的最新里程碑。GPT-4是大型的多模态模型(能够接受图像和文本类型的输入,给出文本输出),尽管GPT-4在许多现实世界的场景中能力不如人类,但它可以在各种专业和学术基准上,表现出近似人类水平的性能。 例如:GPT-4通过了模拟的律师考试,分数约为全部应试者的前10%。而相比之下,GPT-3.5的分数大约是后10%。我们团队花了6个月的时间,利用我对抗性测试项目以及基于ChatGPT的相关经验,反复对GPT-4进行调整。结果是,GPT-4在事实性(factuality)、可引导性(steerability)和拒绝超范围解答(非合规)问题( refusing to go outside of guardrails.)方面取得了有史以来最好的结果(尽管它还不够完美) 在过去两年里,我们重构了整个深度学习堆栈,并与Azure合作,为工作负荷从头开始,共同设计了一台超级计算机。一年前,OpenAI训练了GPT-3.5,作为整个系统的首次 "试运行",具体来说,我们发现并修复了一些错误,并改进了之前的理论基础。因此,我们的GPT-4训练、运行(自信地说:至少对我们来说是这样!)空前稳定,成为我们首个训练性能可以进行提前准确预测的大模型。随着我们继续专注于可靠扩展,中级目标是磨方法,以帮助OpenAI能够持续提前预测未来,并且为未来做好准备,我们认为这一点,对安全至关重要。 我们正在通过ChatGPT和API(您可以加入WaitList)发布GPT-4的文本输入功能,为了能够更大范围地提供图像输入功能,我们正在与合作伙伴紧密合作,以形成一个不错的开端。我们计划开源OpenAI Evals,也是我们自动评估AI模型性能的框架,任何人都可以提出我们模型中的不足之处,以帮助它的进一步的改进。 能力 在简单闲聊时,也许不太好发现GPT-3.5和GPT-4之间的区别。但是,当任务的复杂性达到足够的阈值时,它们的区别就出来了。具体来说,GPT-4比GPT-3.5更可靠,更有创造力,能够处理更细微的指令。 为了理解这两个模型之间的差异,我们在各种不同的基准上进行了测试,包括模拟最开始那些为人类设计的考试。通过使用最新的公开测试(就奥数和AP等等考试)还包括购买2022-2023年版的练习考试来进行,我们没有为这类考试给模型做专门的培训,当然,考试中存在很少的问题是模型在训练过程中存在的,但我们认为下列结果是有代表性的。 我们还在为机器学习模型设计的传统基准上,对GPT-4进行了评估。GPT-4大大超过现有的大语言模型,与多数最先进的(SOTA)模型并驾齐驱,这些模型包括针对基准的制作或额外的训练协议。 由于现有的大多数ML基准是用英语编写的,为了初步了解其他语言的能力,我们使用Azure Translate将MMLU基准:一套涵盖57个主题的14000个选择题,翻译成了各种语言。在测试的26种语言中的24种语言中,GPT-4的表现优于GPT-3.5和其他大模型(Chinchilla,PaLM)的英语表现,这种优秀表现还包括类似拉脱维亚语、威尔士语和斯瓦希里语等等。 我们一直在内部使用GPT-4,发现它对支持、销售、内容审核和编程等功能会产生很大影响,我们还在用它来协助人类评估AI的输出,这就是我们调整战略的第二阶段的开始。 视觉输入 GPT-4可以接受文本和图像的提示语(prompt),这与纯文本设置平行。比如说,可以让用户指定任何视觉或语言任务,它可以生成文本输出(自然语言、代码等),给定的输入包括带有文字和照片的文件、图表或屏幕截图,GPT-4表现出与纯文本输入类似的能力。此外,还可以应用在为纯文本语言模型开发的测试时间技术,包括少数几个镜头和CoT的Prompting,不过目前图像输入仍然属于研究方面预览,没有像C端公开产品。 下列图片显示了一个 "Lightning Cable "适配器的包装,有三个面板。 面板1:一个带有VGA接口(通常用于电脑显示器的大型蓝色15针接口)的智能手机插在其充电端口。 面板2:"Lightning Cable "适配器的包装上有一张VGA接口的图片。 面板3:VGA连接器的特写,末端是一个小的Lightning连接器(用于为
iPhone
和其他苹果设备充电)。 这张图片的搞笑性质来自于将一个大的、过时的VGA连接器插入一个小的、现代的智能手机充电端口..因此看起来很荒谬 通过在一套狭窄的标准学术视觉基准上,对GPT-4的性能进行评估,并且对它进行预览。然而,这些数字并不能代表其的能力范围,因为我们发现,这个模型能够处理很多的新的和令人兴奋的任务,OpenAI计划很快发布进一步的分析和评估数字,以及对测试时间技术效果的彻底调查结果。 可控制的AI 我们一直在努力实现关于定义AI行为那篇文章中,所概述的计划的每个方面,包括AI的可控制性。与经典的ChatGPT个性的固定言语、语气和风格不同,开发者(很快就是所有的ChatGPT用户)现在可以通过在 "系统 "消息中描述这些方向,来规定自己的AI的风格和任务。系统消息允许API用户在范围内,大幅对用户体验进行定制,我们将持续改进。 局限性 尽管能力惊人,不过,GPT-4仍存在与早期GPT模型类似的限制。最重要的是,它仍然不是完全可靠的(比如说,它会对事实产生 "幻觉",并出现推理错误)。在使用语言模型的输出时,特别是在高风险的情况下,应该非常小心谨慎,比如说:需要人类审查,完全避免高风险的使用)以及需要与特定的使用案例的需求相匹配。 尽管各类情况仍然存在,但相较于以前的模型(这些模型本身也在不断改进),GPT-4大大减少了hallucinations(意思是网络错觉,这里指的是一本正经的胡说八道)。在我们内部的对抗性事实性评估中,GPT-4的得分比我们最新推出的GPT-3.5高40%。 可控制的AI GPT-4的基础模型在这项任务中只比GPT-3.5略胜一筹;然而,在经过RLHF的后期训练后(应用我们对GPT-3.5使用的相同过程),却有很大差距。该模型在其输出中会有各种偏差,我们在这些方面已经取得了进展,但仍有更多工作要做。根据我们最近的博文,我们的目标是使我们建立的人工智能系统具有合理的默认行为,以反映广泛的用户价值观,允许这些系统在广泛的范围内被定制,并获得公众对这些范围的意见。 GPT-4通常缺乏对其绝大部分数据截止后(2021年9月)发生的事件的了解,也不会从其经验中学习。它有时会犯一些简单的推理错误,这似乎与这么多领域的能力不相符,或者过于轻信用户的明显虚假陈述。有时它也会像人类一样在困难的问题上失败,例如在它产生的代码中引入安全漏洞。GPT-4也可能在预测中自信地犯错。 风险和缓解措施 我们一直在对GPT-4进行迭代,使其从训练开始就更加安全,保持一致性,我们所做的努力包括预训练数据的选择和过滤、评估,邀请专家参与,对模型安全改进、监测,以及执行。 GPT-4与过去的模型会存在类似风险,如生产有害的建议、错误代码或不准确的信息。然而,GPT-4的额外能力还导致了新的风险面。为了明确这些风险的具体情况,我们聘请了50多位来自人工智能对接风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家对该模型进行对抗性测试。他们的参与,使我们能够测试模型在高风险领域的行为,这些领域需要专业知识来评估。来自这些领域专家的反馈和数据,为我们缓解和改进模型提供了依据。比如说,我们已经收集了额外的数据,以提高GPT-4拒绝有关如何合成危险化学品的请求的能力。 GPT-4在RLHF训练中加入了一个额外的安全奖励信号,通过训练模型来拒绝对此类内容的请求,从而减少有害产出(由我们的使用指南定义)。奖励是由GPT-4的分类器提供的,它能够判断安全边界和安全相关提示的完成方式。为了防止模型拒绝有效的请求,我们从不同的来源(例如,标记的生产数据,人类的红队,模型生成的提示)收集多样化的数据集,并在允许和不允许的类别上应用安全奖励信号(存在正值或负值)。 与GPT-3.5相比,我们的缓解措施大大改善了GPT-4的许多安全性能。与GPT-3.5相比,我们将模型对非法内容的请求的响应倾向,降低了82%,而GPT-4对敏感请求(如医疗建议和自我伤害)的响应符合我们的政策的频率提高了29% 总的来说,我们的模型级干预措施增加了诱发不良行为的难度,但仍然存在 "越狱 "的情况,以产生违反我们使用指南的内容。随着人工智能系统的 风险的增加,在这些干预措施中实现极高的可靠性将变得至关重要。目前重要的是,用部署时间的安全技术来补充这些限制,如想办法监测。 GPT-4和后续模型,很有可能对社会产生正面或者负面的影响,我们正在与外部研究人员合作,以改善我们对潜在影响的理解和评估,以及建立对未来系统中可能出现的危险能力的评估。我们将很快分享我们对GPT-4和其他人工智能系统的潜在社会和经济影响的更多思考。 训练过程 和之前的GPT模型一样,GPT-4基础模型的训练是为了预测文档中的下一个单词,并使用公开的数据(如互联网数据)以及我们授权的数据进行训练。这些数据是来自于极大规模的语料库,包括数学问题的正确和错误的解决方案,弱的和强的推理,自相矛盾的和一致的声明,以及种类繁多的意识形态和想法。 因此,当被提示有一个问题时,基础模型可以以各种各样的方式作出反应,而这些反应可能与用户的意图相去甚远。为了使其与用户的意图保持一致,我们使用人类反馈的强化学习(RLHF)对模型的行为进行微调。 注意,模型的能力似乎主要来自于预训练过程,RLHF并不能提高考试成绩(如果不主动努力,它实际上会降低考试成绩)。但是对模型的引导来自于训练后的过程--基础模型需要及时的工程,甚至知道它应该回答问题。 可预测的扩展 GPT-4项目的一大重点是建立一个可预测扩展的深度学习栈。主要原因是,对于像GPT-4这样非常大的训练运行,做大量的特定模型调整是不可行的。我们对基础设施进行了开发和优化,在多种规模下都有非常可预测的行为。为了验证这种可扩展性,我们提前准确地预测了GPT-4在我们内部代码库(不属于训练集)中的最终损失,方法是通过使用相同的方法训练的模型进行推断,但使用的计算量要少10000倍。 我们认为,准确预测未来的机器学习能力是安全的一个重要部分,相对于其潜在的影响,它没有得到足够的重视(尽管我们已经被几个机构的努力所鼓舞)。我们正在扩大我们的努力,开发一些方法,为社会提供更好的指导,让人们了解对未来系统的期望,我们希望这成为该领域的一个共同目标。 开放式人工智能评估 我们正在开源OpenAI Evals,这是我们的软件框架,用于创建和运行评估GPT-4等模型的基准,同时逐个样本检查其性能。我们使用Evals来指导我们模型的开发(包括识别缺点和防止退步),我们的用户可以应用它来跟踪不同模型版本(现在将定期推出)和不断发展的产品集成的性能。例如,Stripe已经使用Evals来补充他们的人工评估,以衡量他们的GPT驱动的文档工具的准确性。 因为代码都是开源的,Evals支持编写新的类来实现自定义的评估逻辑。然而,根据我们自己的经验,许多基准都遵循一些 "模板 "中的一个,所以我们也包括了内部最有用的模板(包括一个 "模型分级Evals "的模板--我们发现GPT-4有令人惊讶的能力来检查自己的工作)。一般来说,建立一个新的评估的最有效方法是将这些模板中的一个实例化,并提供数据。我们很高兴看到其他人能用这些模板和Evals更广泛地建立什么。 我们希望Evals成为一个分享和众包基准的工具,最大限度地代表广泛的故障模式和困难任务。作为后续的例子,我们已经创建了一个逻辑谜题评估,其中包含GPT-4失败的十个提示。Evals也与实现现有的基准兼容;我们已经包括了几个实现学术基准的笔记本和一些整合CoQA(小的子集)的变化作为例子。 我们邀请大家使用Evals来测试我们的模型,并提交最有趣的例子。我们相信Evals将成为使用和建立在我们的模型之上的过程中不可或缺的一部分,我们欢迎直接贡献、问题和反馈。 ChatGPT Plus ChatGPT Plus用户将在chat.openai.com上获得有使用上限的GPT-4权限。我们将根据实际需求和系统性能调整确切的使用上限,但我们预计容量将受到严重限制(尽管我们将在接下来的几个月里扩大和优化)。 根据我们看到的流量模式,我们可能会为更高的GPT-4使用量引入一个新的订阅级别,我们也希望在某个时候提供一定数量的免费GPT-4查询,这样那些没有订阅的用户也可以尝试。 API 要获得GPT-4的API(使用与gpt-3.5-turbo相同的ChatCompletions API),请可以去OpenAI的官方Waitlist上注册。 结论 我们期待着GPT-4成为一个有价值的工具,通过为许多应用提供动力来改善人们的生活。还有很多工作要做,我们期待着通过社区的集体努力,在这个模型的基础上进行建设、探索和贡献,共同对模型进行改进。 参考文献:1.https://openai.com/research/gpt-4 2.https://techcrunch.com/2023/03/14/openai-releases-gpt-4-ai-that-it-claims-is-state-of-the-art/ 3.https://www.theverge.com/2023/3/14/23638033/openai-gpt-4-chatgpt-multimodal-deep-learning 来源:金色财经
lg
...
金色财经
2023-03-15
论所有权的终结 以及基于NFT的版权解决方案
go
lg
...
用户只能购买使用原厂家的墨水;当你购买
iPhone
的时候,你只拥有
iPhone
硬件的财产权,而你只获得了iOS的许可协议,Apple可以限制你只能安装某些软件。 如果大家以为这种事情只发生在有软件控制的智能设备的情况下,那么就太天真了。因为全球最大的种子公司孟山,都早已经将销售种子的合同变成了许可协议,农民自己培育保留的种子不能使用,反而需要每年都从孟山都购买新的种子。 大家熟知的汽车,你虽然拥有汽车,但是却不允许读取或者修改汽车的软件。汽车公司可以通过软件限制用户,必须在汽车公司授权的价格昂贵的维修点维修。可以预想的未来,Tesla汽车价值中软件的价值比重越来越大。未来的Tesla,可能离开了Tesla的软件授权,汽车就无法加速,就像你的
iPhone
一样。 毫不夸张地说,数字经济时代,用户的财产权受到了极大的侵害。用户和立法者需要认识到这些问题,并且寻找新的技术手段来保护消费者的权益。 NFT作为物理介质在数字世界的唯一标识,提供了传统财产权法律应用于数字资产的一个桥梁。 不管一首歌的MP3,还是一张jpeg图片,都可以被版权作者限量发行NFT,合法购买的用户可以在播放器合法播放,并且可以自由转让。虽然不能解决非法复制的问题,但是相比现有的版权保护方案,在不伤害版权方利益的前提下,我们在保护用户财产权力用尽方面前进了一大步。随着未来数字资产指纹技术等防拷贝技术的发展,相信复制盗版的问题可以得到解决。 另外,如果用户想真正保护自己的数字财产,那么就需要自己拥有自己的存储空间。毕竟,保存在服务商提供的云空间里面的资产,可以被服务商随意更改的许可协议所删除。如果大家就购买的电影下载到自己的存储空间,才会有保护自己数字资产的基础。所以,爱奇艺控屏事件之后,很多用户开始购买家庭存储NAS设备。 来源:金色财经
lg
...
金色财经
2023-03-14
A股头条:暴跌熔断!美银行股重挫;比特币涨15%,离岸人民币大涨1000点;首批11家主板注册制IPO企业全过会
go
lg
...
内的销量仅为100万台左右,低于第一代
iPhone
或Apple Watch推出后一年的销量。不过,接近苹果的人士表示,尽管销售目标不高,但苹果正准备打响一场营销闪电战。评:之前脸书、腾讯和字条相继调整了VR业务,特别是腾讯直接把这个项目团队都砍掉了。现在就看苹果又来当铁头娃了,看看苹果有多大本事。 4、北向资金周一净买入27.7亿元 浪潮信息净卖出额居首 北向资金周一净买入27.7亿元。特变电工、紫金矿业、五粮液分别获净买入4.87亿元、2.75亿元、2.63亿元。浪潮信息净卖出额居首,金额为3.08亿元。 5、首批11家主板注册制IPO企业全部过会 业内人士:最快4月就能在沪深主板挂牌上市 沪深交易所官网信息,3月13日,中信金属、江盐股份、常青科技、中重科技、柏诚股份、中电港、陕能股份、海森药业、华纬科技、南矿集团、登康口腔等11家主板IPO企业成功过会,这也是全面注册制下首批过会的主板IPO企业。上市委审议后,过会企业接下来还需报送证监会,等待证监会注册,在获取注册批文后企业才能发行上市。若上述企业本周能获取注册批文,则最快4月就能在沪深主板挂牌上市。 6、拜登:需要对银行业发生的事情进行全面问责 将要求国会和监管机构加强银行监管 美国总统拜登就银行业形势发表讲话时表示,政府的迅速行动应该让美国人相信美国银行系统是安全的。美国联邦存款保险公司已经控制了签名银行的资产。美国纳税人不会承担任何损失,资金将来自保险基金费用。拜登还表示,需要对银行业发生的事情进行全面问责,将要求国会和监管机构加强银行监管。 评:虽然问题的根源处在美联储毫无节操的风水之后,来了一波史无前例的加息潮,但是最终还是要找人背锅。 隔夜外盘 美股:“救市到位股市却仍在下跌,是新低快来还是崩盘在即?”利率峰值预期下降,SVB倒闭的恐慌情绪加速蔓延,两股相反的情绪把美股往不同的方向拉扯、财政部、美联储和联邦存款保险公司的联手救助未能挽救投资者信心,美股全天震荡,道指跌近百点连续五日收跌,标普微跌0.15%,纳指涨0.45%;银行股再度重挫,加密货币类股走高,KBW银行板块跌超11%,标准普尔500银行业指数下跌7.0%创自2020年6月11日以来最大单日跌幅,第一共和银行跌61%,阿莱恩斯西部银行跌47%,西太平洋众合银行跌21%,嘉楠科技涨逾14%,比特矿业涨近9%,拼多多和B站涨超6%。据不完全统计,美股盘中超过10家中小银行股价触及熔断。 商品:在避险情绪推动下,金银等贵金属跳涨,黄金期货大涨2.6%报收1916.50美元;现货黄金同样升破1910美元整数位,创2月3日以来的逾五周最高;期银和现货白银最高涨约7%至三周新高。纽约原油跌2.45%报74.80美元,盘中创2月5日以来最低且下逼72美元;布伦特原油跌幅2.43%报80.77美元,盘中创1月6日以来最低且一度失守80美元;美国天然气期货涨超7%脱离两周低位。 外汇及加密货币:美元指数DXY一度失守103.50,连跌四日至2月15日以来的四周新低;日元兑美元升穿134关口至2月14日以来的一个月新高;离岸人民币最高涨1064点,日高上逼6.83元创2月15日以来的三周半最高;两年期美债收益率最深跌65个基点,至少创2008年以来最大单日跌幅,并一度失守4%关口至去年9月18日以来的半年新低;盘中在三个交易日里累跌超100个基点,为1987年10月美股“黑色星期一”股灾以来的最大三日跌幅。10年期美债收益率一度失守3.50%并下逼3.41%,创2月3日以来的五周新低。主流加密数字货币不少两位数百分比跳涨,整体市值涨超700亿美元并重上1万亿美元。比特币尾盘涨超15%,日内接连升破2.2万至2.4万美元三道整数位,至2月21日以来的三周高位。以太坊涨9%并升破1680美元,至2月20日以来最高。 市场策略 周一多数股指收涨,沪指涨超1%,仅创业板指下跌。 A股虽然反弹,但沪市涨跌个股家数基本五五开,深市上涨个股家数略低于下跌家数。沪指强势是靠拉中国移动为首的中字头股,有所失真。从中证1000指数来看,这里只是破位后的反抽,短期可能还会继续上冲,但空间很有限,随后仍将再度掉头向下。 题材掘金 题材掘金 贵金属:美联储利率掉期目前显示,市场对美联储6月加息幅度的预期为20个基点,而3月加息幅度仅为6个基点。此外,美联储利率掉期还显示联邦基金利率会在今年6月触顶,12月前降息约60个基点。受此影响,黄金、白银价格均大涨。 标的:华钰矿业(601020)、金贵银业(002716) 数字人:近日,AI数字人林开开成为百度首位可交互超写实数字人,以逼真的形象、生动的交互能力,向公众在线解读最高人民法院工作报告,形象展示人民法院五年来的工作成效。 标的:天娱数科(002354)、捷成股份(300182) 鸡苗:近日国内鸡苗价格持续攀升,截至3月13日,主产区之一山东烟台鸡苗报价达6.7元/羽,环比上月同期上涨超59%。 标的:益生股份(002458)、民和股份(002234) 公告精选 【重大事项】 和而泰 002402:签订2.46亿欧元长期供应合同 隆基绿能 601012:拟77.77亿元投建年产30GW高效单晶电池项目 【业绩速递】 慧博云通 301316 业绩快报:2022年净利润8936万元 同比增长16.8% 贵航股份 600523:2022年度净利润同比下降19.7% 拟10派1.1元 广州酒家 603043:1-2月净利润同比增长33.8% 东方中科 002819 业绩快报:2022年净利润同比增407% 华阳股份 600348 业绩快报:2022年净利润同比增长98.95% 【并购重组】 苏州高新 600736:筹划向特定对象发行股票 胜华新材 603026:向特定对象发行股票申请获得上交所受理 新城控股 601155:拟定增募资不超过80亿元 新湖中宝 600208:拟申请发行不超过20亿元中期票据 勤上股份 002638:终止向特定对象发行股票事项 华中数控 300161:拟定增募资不超过10亿元 【增持减持】 赛轮轮胎 601058:拟以4亿元-8亿元回购股份 【其他事项】 长源东谷 603950:收国内某知名新能源汽车客户的开发定点通知书 赛升药业 300485:参股公司康乐卫士将在北交所上市 东方电气 600875:董秘龚丹退休离任 安洁科技 002635:拟设立墨西哥子公司 乾景园林 603778:拟向控股子公司增资2000万元 上海建工 600170:联合体竞得土地使用权 天元宠物 301335:拟投资建设天元宠物产业园 百花医药 600721:副总经理辞职 中国人寿 601628:1-2月累计原保险保费收入约为2412亿元 宁科生物 600165:控股股东拟终止股份转让事项 莫高股份 600543:出售所属分公司饮马麦芽厂的部分固定资产 赛诺医疗 688108:子公司产品获得国内医疗器械注册证 渤海化学 600800:全资子公司PDH装置例行停产检修延期 绿能慧充 600212:西安子公司拟对全资子公司增资3500万元 药石科技 300725:拟12亿元投建创新药物工艺开发及中试平台项目 立方制药 003020:取得盐酸文拉法辛缓释片药品注册证书 金力泰 300225:董事王超辞职 汉仪股份 301270:拟1600万元认购赛博爱思11.94%的股权 中铁工业 600528:子公司入选创建世界一流专精特新示范企业 海南高速 000886:子公司签订6.04亿元建设项目工程总承包合同 金刚光伏 300093:子公司吴江金刚与泉为科技 300716:签订太阳能电池片购销合同 美联新材 300586:控股子公司美彩新材拟全部收购辉虹科技全体股东持有的辉虹科技股权 片仔癀 600436:收到温胆片Ⅱ期临床试验总结报告 上机数控 603185:公司名称拟变更为弘元绿色能源股份有限公司 派斯林 600215:拟对全资子公司增资4500万元 贝达药业 300558:BPI-472372片获得临床试验批准通知书 众生药业 002317:收到一类创新药RAY1225注射液药物临床试验批准通知书 牧原股份 002714:拟设立子公司开展新能源相关业务 众合科技 000925:拟对全资子公司众合智行增资不超过13亿元 英飞特 300582:拟合计3875万欧元向境外全资子公司增资 中国人保 601319:1-2月原保险保费收入合计约1667.07亿元 嘉友国际 603871:1至2月公司跨境综合物流业务量总吨数257.94万吨 同比增长288.35% 宇通客车 600066:实控人拟发生变更为汤玉祥先生 皖能电力 000543:拟以22.08亿元收购环保发电公司和四家蓄能公司部分股权 平煤股份 601666:拟转让控股子公司平煤煌龙新能源有限公司51%股权 富春染织 605189:拟7亿元投资年产11万吨高品质筒子纱染色建设项目 威星智能 002849:拟对外投资江西赛酷1.6亿元 江南化工 002226:拟以5.44亿元收购北方民爆100%股权 交易提示 【限售解禁】
lg
...
金融界
2023-03-14
苹果迎来离职潮 公司面临新挑战?半年内已有多达12名高管离职!
go
lg
...
其销售业务,重点关注印度市场,一款黄色
iPhone
即将上市,亚马逊的Ring和Sonos也将推出重要的新产品。 以高层稳定著称的苹果公司正面临着新的挑战,高管人员的流动率达到了前所未有的水平。从2022年下半年开始的一段时间里,苹果失去了大约12名高管。其中大多数人的头衔都是副总裁,略低于向首席执行官蒂姆·库克汇报的高级副总裁。他们是苹果公司最重要的人物,负责许多核心功能的日常运营。 离职的副总裁包括负责工业设计、在线商店、信息系统、苹果云计算、硬件和软件工程、隐私问题、新兴市场销售、订阅服务和采购等领域的,总共有11名关键人员。在过去的几年里,苹果可能会在12个月的窗口期失去一两个副总裁,现在的大批离职非常值得注意。 当然,也有大量高管涌入。苹果公司请来了一位新的首席人力资源官来接替零售主管Deirde O 'Brien的职责,并请来了一位首席信息官来接替Mary Demby和David Smoley。 最近离职的大多数都是在苹果工作了15年以上的老员工,苹果失去的高管都处于职业生涯的黄金时期,他们本有可能在某一天升到高级副总裁的级别。 苹果的最高层也处于类似的情况,12位高管中有10位年龄相仿。他们中有一半人是在2000年之前加入苹果公司的,而库克和他最有可能的继任者、运营总监威廉姆斯之间的年龄差距只有两岁左右。 在某些情况下,苹果公司的副总裁被认为是取代公司高级副总裁的人选,可能会带来四到五倍的加薪,但公司可能从未明确表示这种情况是否或何时会发生。 苹果公司的结构本身就是压力的来源之一,公司公司是按功能组织的,团队对其所有大产品都有贡献。例如,硬件工程副总裁将负责监督
iPhone
、Apple Watch、iPad、Mac和AirPods的部分产品。而软件工程负责人将负责管理为iOS、macOS、watchOS和tvOS做出贡献的团队。这种组织方式在苹果的早期是有意义的,但却导致了产品开发延迟的增加,资源分布过于分散,以及额外的工程复杂性。 苹果股价在连续三年大幅上涨后,去年下跌了近30%,对薪酬构成了压力。以苹果公司副总裁为例,他的股票收入可能远远超过工资的一半。 在这方面,就连库克也受到了冲击。上周五苹果股东通过了一项新的薪酬方案,其中包括减薪约40%。他2023年收入的80%以上将投资于股票,其中75%与公司业绩挂钩。 苹果(Apple)将目光投向了印度。该公司正在调整其海外销售业务,目标是提高印度市场的重要性。印度迅速成为苹果的关键市场,在假日财季全球营收下滑之际,印度市场的营收实际上有所增长。 对苹果来说,印度是否会成为中国那样的市场还不确定,但这确实是希望。库克今年早些时候表示:“从本质上讲,我们是在吸取多年前在中国学到的东西,并将其付诸实践。”
lg
...
Sue
2023-03-13
维信诺:高营收高增长高市占率,“估值洼地”引发市场关注
go
lg
...
,已成为手机厂商的重要选择。当前,苹果
iPhone
13的Pro和Pro Max产品第一次已应用LTPO,小米以及三星品牌也在其旗舰机型及折叠手机产品上采用LTPO技术。据CINNO Research数据,2025年中国OLED智能机市场采用LTPO技术的柔性OLED产品渗透率有望达到43%。 其次,从国内产业发展趋势来看,随着国内OLED显示技术不断提升,与韩国等国家的技术差距缩小,OLED头部企业有望凭借技术优势,获得更多市场份额。 国内随着OLED技术不断发展,国内产品市场份额不断提升。数据显示,2019年底三星OLED屏市场份额达88%,2022年前9月份额跌至62.9%。同期,国内OLED厂商的市场份额从3%左右,提升至30%。两项数据看出,三星OLED屏减少的份额与国内OLED厂商增加的份额基本相等,完成了国产替代。 维信诺2021年OLED显示产品生产量约0.32亿片,据CINNO Research数据,公司2022年OLED显示产品生产量约0.40亿片,同比增长超过20%。目前,维信诺的AMOLED智能手机面板市场份额达到6.8%,位居国内第二。 与头部手机客户保持供货关系,低估具备价值 维信诺成立于2001年,前身是1996年成立的清华大学OLED项目组。维信诺专注OLED事业20余年,凭借规模、技术、品牌等诸多优势,公司与荣耀、小米、OPPO、vivo、中兴、努比亚、华米等品牌客户保持良好密切的合作关系,顺利导入多家品牌客户的高端产品。 东兴证券认为,维信诺是手机OLED领军企业,受益于高端产品渗透与国产化进程,公司业绩迎来释放期。预计2022至2024年,维信诺EPS分别为-1.48元,-0.79元和-0.08元。当前,公司处于产能扩张期,当前股价对应2023年PB为0.88倍,相较于同行京东方(1.26倍PB)与TCL科技(1.55倍PB)估值水平已明显低估,首次覆盖,给予“推荐”评级。 备注:研究报告原标题为《电子 | 维信诺(002387)深度:高端渗透与国产替代并进,手机OLED份额跃居全球前三》。
lg
...
金融界
2023-03-13
GPT-4将在下周发布 必应日活破亿 谷歌还有招架之力吗
go
lg
...
T给人们日常生活带来的影响与十多年前的
iPhone
相似。 由Saya Nadella领导的公司也明确表示,GPT-4不是来抢人饭碗的,而是帮助人类简化工作、提升质量。 高调官宣:必应日活首次破亿 而在3月8日,ChatGPT版必应的日活用户数在历史上首次突破了1亿,这距离它在2月8号的发布,正好一个月。 前有ChatGPT用时俩月月活破亿,今有ChatGPT版必应用时一月日活破亿,微软真的是在不断创造奇迹。 现在,每天有1/3的预览版用户都在使用ChatGPT版必应,而且自推出以来,用户已经和必应进行了4500万次聊天。 博文地址:https://blogs.bing.com/search/march_2023/The-New-Bing-and-Edge-%E2%80%93-Momentum-from-Our-First-Month/ 虽然必应的市场份额与谷歌相比还差得多,但在经历了长达数年的疲软之后,微软对这次的增长还是非常满意的。 副总裁Yusef Mehdi在最新的博文中表示:「我们很高兴与大家分享,经过几年的稳步发展,再加上100多万新的必应预览用户的一点点推动,我们的必应日活跃用户已经突破了1亿。」 除此之外,随着新的应用程序的推出,必应在移动端的日活用户也增加了6倍。 顺便,微软再再再次放宽了ChatGPT版必应聊天限制——每天120轮对话,每轮10句。 前几周,微软刚刚制定了计划,要在价值约5000亿美元的数字广告市场上,进一步增加收入。 微软财务副总裁Philippe Ockenden在上个月与分析师的电话会议上说:「搜索广告市场的份额每增加1个点,我们的广告业务就有20亿美元的收入机会。」 在过去的12个月里,微软的广告业务收入已经增长到180亿美元,而上一财年为100亿美元。 这个成就在很大程度上要归功于必应,但要接近谷歌2022年超过2000亿美元的广告收入,微软仍有很长的路要走。 但对微软来说,这是一个从谷歌那里抢占市场份额、虎口夺食的最好机会。 ChatGPT正式加入Azure OpenAI,同时还有GPT-3.5、Dall-E 2 除了搜索引擎,ChatGPT也被微软火速整进了云平台Azure中。 今年1月中旬,纳德拉就曾预告,微软即将在Azure中整合进ChatGPT。 微软说到做到,这才不到俩月,就正式完成了。 北美时间3月9日,微软在官方博客宣布,ChatGPT已被正式整合进Azure Open AI服务中,现在是预览版。 (体验地址:https://azure.microsoft.com/en-in/products/cognitive-services/openai-service/) 这意味着,企业和个人开发者现在都可以借助Azure OpenAI服务,用上最先进的AI模型,包括Dall-E 2、GPT-3.5、Codex等。 比如GitHub Copilot通过Azure OpenAI服务中的Codex模型,能帮开发者自动生成代码。 使用Power Platform中的Co-pilot,用户能够编写Power Fx命令,甚至实现自动化流程 Microsoft Teams Premium通过GPT-3.5模型打造了「智能回顾」功能,可以自动生成会议记录、笔记、实时翻译等。 Microsoft Viva Sales通过GPT-3.5模型提升了销售效率,可自动生成邮件内容、生成个性化销售文案等。 Azure OpenAI Studio的无代码开发模式,能让企业和开发者快速开发智能应用程序和解决方案。 在设计软件中,Azure OpenAI使用了DALL·E 2模型,在提示栏中不断明确自己的要求,软件就会生成越来越符合用户要求的图像 其实前几天,微软就已宣布低代码应用平台Power Platform整合进ChatGPT,开发者可以使用最少的代码创建应用程序。链接 借助Azure OpenAI服务中的ChatGPT预览版,企业和开发者可以把它的功能直接集成到应用产品中,私人定制自己的ChatGPT,提供个性化客户服务,生成个性化营销文案,建立企业级智能化知识库搜索引擎等。 技术公司可以快速将机器人连接到不同的产品,支持知识库和常见问题解答,在不编写任何代码的前提下,就能为客户提供支持 微软的办公软件帝国,眼看要成形了。 谷歌埋葬了自己 其实,谷歌不是没有这样的机会。 据华尔街日报称,几年前,2名前谷歌工程师曾push高管向公众发布ChatGPT类似聊天机器人,但直接被毙掉了。 原因很简单,不安全。 可以说,谷歌高管们谨慎的态度把自家的前程给葬了。 2018年,谷歌研究工程师Daniel De Freitas开始从事一个人工智能副项目,目标是创建一个模仿人类说话方式的对话聊天机器人。 谷歌人工智能研究部门的软件工程师Noam Shazeer后来加入了该项目。 当时,De Freitas和Shazeer建立的聊天机器人称为「Meena」,随后便更名了,也就是现在的LaMDA。 Meena能够哲学辩论、随意谈论电视节目、还能做双关。当时,他们相信Meena可以从根本上改变人们在网上搜索的方式。 他们多次尝试将聊天机器人对外公布,将聊天功能添加到Google Assistant,并向公众推出演示。 不幸的是,谷歌高管表示,聊天机器人不遵守其AI安全和公平标准,推出机聊天器人的计划便陷入了僵局。 高管们的反应,让De Freitas和Shazeer非常失望。因此,他们在2021年底离开谷歌创办了自己的公司,尽管谷歌CEO皮查伊亲自要求他们留下来继续从事聊天机器人的工作。 他们成立的这家公司名为Character.Ai,并在此后发布了一个聊天机器人,可以扮演埃隆马斯克或任天堂的马里奥等人物。 Shazeer上个月在接受采访时表示,这在谷歌内部引起了一些轰动。但最终我们决定,作为一家初创公司,我们可能会有更多的运气推出产品。 谷歌对人工智能采取小心谨慎的态度并不是什么新鲜事儿了。自2012年以来,这家公司一直在阻挠其人工智能工作。 2012年,谷歌聘请了计算机科学家Ray Kurzweil来研究其语言处理模型。大约一年后,谷歌收购了英国人工智能公司DeepMind,该公司旨在创建通用人工智能。 然而,出于对大规模监控的道德担忧,学者和技术专家推迟了使用这项技术,谷歌对限制其使用人工智能的方式做出了承诺。 2018年,由于员工的强烈反对,谷歌宣布终止将其人工智能技术用于军事武器的项目。 尽管谷歌Bard聊天机器人在上个月的第一次公开演示中犯下一个事实错误后,导致谷歌股价大跌。 但谷歌的人工智能计划现在可能终于看到了曙光。 Alphabet董事长John Hennessy认为,谷歌的聊天机器人还没有真正为产品做好准备。CE皮查伊要求所有谷歌员工花两到四个小时的时间帮助测试产品,以便为发布做好准备。 皮查伊在二月份的一份备忘录中写信给谷歌员工: 我知道这一刻令人不安地兴奋,这是意料之中的。底层技术正在迅速发展,潜力巨大。我们现在能做的最重要的事情是专注于构建一个伟大的产品并负责任地开发它。 17年,谷歌提出了Transformer,为如今大语言模型的种种繁荣景象夯实了基础,然而,谷歌自己却没能把握住时代的命脉,自己制霸多年的搜索引擎和办公软件市场,现在眼看就要被微软偷家。 一个太过谨慎的巨头,是怎样被锐意进取、打法创新的对手击败的? 这个故事值得我们深思。 参考资料: https://www.theverge.com/2023/3/9/23631912/microsoft-bing-100-million-daily-active-users-milestone https://www.gearrice.com/update/gpt-4-will-arrive-next-week-and-will-be-multimodal/ https://www.businessinsider.com/google-ai-chatbot-chatgpt-years-ago-execs-shut-down-report-2023-3 来源:新智元、DeFi之道 原标题:《GPT-4下周王者登基!必应日活破亿,谷歌已被打残》 来源:金色财经
lg
...
金色财经
2023-03-12
美股收盘:道指跌近350点 中概股多数下挫雾芯科技逆势涨15%
go
lg
...
最灵活的地区之一,有助于推动在印度生产
iPhone
的计划。 微软德国公司的首席技术官布劳恩透露,“我们将在下周推出GPT-4,它将是一个多模态模型,会提供完全不同的可能性——例如视频。”这项技术已经发展到基本上“适用于所有语言”,也就是说“可以用德语提问,然后用意大利语得到答案”。
lg
...
金融界
2023-03-11
高盛回心转意 6年来首度推荐买入苹果股票,分析师预计未来12个月上涨约13%!
go
lg
...
com)等大型科技公司。 对苹果电脑和
iPhone
需求即将下降以及供应瓶颈的担忧已经消散,高盛本周转为看多该股,这是近6年来首次。此前,高盛在苹果股票股价上涨逾四倍时基本持观望态度。 Waddell and Associates首席投资策略师David Waddell表示:“苹果强大的资产负债表、才华横溢的团队和创新能力,可能被投资者视为股票投资的安全场所。” 时间倒回到去年12月,苹果的形势看起来很黯淡。中国新冠疫情爆发,导致其主要组装伙伴富士康在苹果最重要的季度到来之前停产
iPhone
。1月初,苹果公司股价跌至19个月低点,市值自2021年3月以来首次跌破2万亿美元。 美联储(Federal Reserve)的一系列加息举措也压低了所有高估值科技公司的股价,同时引发了人们对经济将陷入衰退的担忧,影响了电脑和手机的销售。 现在,富士康工厂重新开工,供应链混乱已经消散,需求似乎也在持续增长。 杰富瑞(Jefferies)分析师Kyle McNealy上周在一份报告中写道,苹果也看到了经济压力带来的有限影响,他引用了希望购买
iPhone
的消费者访问网页的流量数据。他说,这表明对手机销售的预期可能太低了。 高盛分析师Michael Ng刚刚接手了公司对苹果股票的报道,并给出了买入评级。他说,苹果公司庞大的用户基础也将使其能够扩大服务部门。苹果服务部门的业务包括Apple Music、Apple TV+和应用商店等服务,约占公司总收入的五分之一,在过去10年里增长了一倍。 分析师认为苹果的其他业务部门也有强劲的增长动力。彭博智库预测,到2024年,苹果AirPod耳机的销售额将达到220亿美元,相当于万事达去年的总收入。 由于美联储警告称加息步伐可能需要重新加快,投资者正在寻找一只在不确定时期表现良好的股票。 苹果公司一直在回报股东,公司在过去12个月回购了880亿美元的股票。根据彭博社汇编的数据,这是美国最大的回购额,几乎超过了其两个最接近的竞争对手Alphabet和Meta平台回购额的总和。 苹果股票绝对不便宜,但目前的预期市盈率为24倍,比疫情期间的35倍要合理得多。根据彭博社编制的平均目标价,分析师预计该股未来12个月将上涨约13%。 2013年苹果的股票回购超过了埃克森美孚(Exxon Mobil),成为标准普尔500指数(S&P 500 Index)年度回购规模最大的公司。这家
iPhone
制造商一直是自己股票的最大买家,通常会在公布第二财季业绩时加大回购计划的力度,下一次增持可能会在4月份。
lg
...
Sue
2023-03-11
ChatGPT爆火之后 AIGC往何处去?
go
lg
...
当前最成功的大型语言模型,我们正在经历
iPhone
Moment ChatGPT可能是目前最成功的语言模型,人们把当下这个ChatGPT诞生的时刻称为“
iPhone
moment”。 GPT是Generative Pre-trained Transformer 的缩写。Transformer神经网络算法是当前最新的一种算法模型,我们会在下文展开。GPT系列模型都是语言模型,是新型神经网络算法、新型模型训练方式加上海量数据算力多重因素叠加产出的成果。 GPT模型有几个主干版本,从 GPT-1、GPT-2、GPT-3演进到最新的GPT-3.5版本。 当下人们使用的ChatGPT是在3.5版本的基础上,专门针对人类需求做了大量微调,引导模型输出更符合人类需求的结果。这让GPT模型逐渐“社会化”,变得更像人。经过微调的ChatGPT“情商”变高了,不再只是个话痨,也不再那么口无遮拦。 ▍ChatGPT的诞生过程 图片来源:微信公众号@AI语者 在ChatGPT问世之前,GPT模型经历了怎样的发展历程? 2017年6月,Google发布Transformer这一神经网络算法模型,它为大型语言模型的发展奠定了基础。 一年之后,OpenAI公司推出了GPT-1,GPT-1采用语言模型预训练+微调训练两阶段的训练方法,在问答和常识推理、语义相似度、分类等任务中,取得了还不错的语言任务执行效果。 2018年10月,Google推出另一个语言模型——BERT,效果超过GPT-1。 图片来源:知乎@雅正冲蛋 GPT和BERT都是基于Transformer衍生出的算法,但在技术路线上各有侧重。GPT基于 Transformer 右边部分,叫解码器。BERT基于 Transformer 的左边部分,叫编码器。 GPT的技术原理是预测下一个词,你可以看作是“文字接龙”,你写出前面的句子,由GPT来猜下一个词。但BERT更像是“完形填空”,其技术原理是把一句话中某个词给遮挡住,然后请BERT来猜。 解码器擅长创作,编码器擅长理解,当时它们要做的更多是屏蔽语言模型(Masked LM,类似“完形填空”)、相邻句子判断(Next Sentence Prediction,判断句子是否能相连)这类偏阅读理解的任务,因此BERT占了上风。 2019年,GPT-2发布,它采用15亿个参数的Transformer解码器,在当时是个比较大的模型。相比BERT,OpenAI研究人员发现,GPT-2预训练的语言模型无需微调训练,可直接执行多种下游任务。这个发现坚定了研究人员沿着现有技术路线,继续研发的决心。 2020年5月,GPT-3诞生,它采用了史无前例的1750亿参数的Transformer解码器,用了接近5000亿单词的文本训练数据。整个训练过程可以说是“大力出奇迹”,让GPT-3在文字生成方面实现质的飞跃。GPT-3除了可以出色完成文字生成、翻译、问答和文本填空等语言类任务外,还“涌现”出了其他一些智能,包括上下文学习,以及更强大的零样本和少样本执行任务的能力,等等。 GPT-3生成的文本质量非常高,有时候人们甚至难以区分文本到底是人类写的,还是GPT-3生成的。 基于GPT-3,已经衍生出很多应用,人们用GPT-3来创作各种类型的文本。有人用它写了一篇新闻,被某热门新闻点评网站排到头部。一家名为Jasper的公司利用GPT-3为企业提供商业文本写作服务,2022年其收入达到9000万美元左右。 GPT-3之后,OpenAI通过增加程序代码训练和人类反馈强化学习等多种训练手段,并将主版本升级到GPT-3.5。最终,2022年11月,ChatGPT横空出世。 ▍训练GPT-3模型的三“大”要素:算法、数据、算力 我们称GPT-3为大模型,这个“大”体现在哪些地方? 首先是算法。GPT-3采用的是Transformer的解码器,具有1750亿个参数和2048个Token(可简单理解为单词,下同)的训练文本长度。 图片来源:OpenAI团队论文 《Language Models are Few-Shot Learners》 第二是数据。上图是GPT-3的训练数据,总共接近5000亿个token的文本,主要包括Common Crawl、Webtext2、Books1、Book2、Wikipedia等等。其中占比最大的训练数据是Common Crawl,它是一个开源的数据集,抓取并保存了全球大量网页的数据。 第三是算力。据微软发布的信息, OpenAI 使用一台全球排名前5的超级计算机系统来训练GPT-3,该系统拥有超过28.5万个CPU核心,1万个GPU和每秒400G的网络。据悉其训练成本约为1200万美元。 02 人们如何看待ChatGPT? ChatGPT诞生以来,引发的讨论非常多。那么说回来,人们如何看待这个新事物,对它又有什么期待?虽然众说纷纭,有3个议题是被频繁提到的。 ▍人们肯定ChatGPT是一个称职的语言模型 首先,ChatGPT是迄今为止最成功的人类语言模型,已经具备形式语言能力(洞悉语言的规则模式等知识)。 ChatGPT具备理解和生成人类语言文本的能力,可跟人类轻松对话。它用数据驱动的大型神经网络的计算方式,某种程度上解码了人类语言的内部规律。这个内部规律不是某种公式,而是一个神秘、暂不被人类理解的权重参数矩阵。 以前,人们认为算法模型如果仅靠输入文本,很难获取关于语言的知识。但如今,ChatGPT可以从文本中直接学习语言的层次结构和抽象类别等,这是一种无监督学习的能力。 此外,ChatGPT也不只是个话痨。它可以写作文、创作诗歌、撰写商业文本、翻译、做阅读理解、代码理解和生成等。可以说,作为一个语言模型,ChatGPT已经比较称职。 ▍人们期待ChatGPT具有思维能力 人们对ChatGPT的期望不仅仅是语言模型,人们甚至期待ChatGPT成为一个思维机器,发展出功能语言能力(用语言思考和做事的能力)。 ChatGPT“涌现”出一些智能,包括上下文学习(理解和学习人类对话输入文字的能力)、世界知识抽象(例如事实性知识和常识)、执行泛化任务(包括没有做过的新任务)、复杂推理等。然而,当前ChatGPT的这些功能都还不算强大,出错甚至崩溃时有发生。 当前,人们在思维机器方向的探索有很多,例如有一种借助思维链(Chain of Thought)的方法,试图引导或者优化语言模型展现出复杂的推理能力。这些研究方向的进展仍在持续。 上图展示的是,一位科研人员在跟ChatGPT的对话中,通过分步骤提示引导的示例训练(引导过程未展示),使ChatGPT展现出分步骤思考和计算的能力。据分析,ChatGPT的这个能力来自GPT-3.5模型本身,思维链训练方法只是让它意识到应该用这种方式来思考和回答问题。整个过程有点类似老师辅导学生做题。 虽然这道题对于10岁的孩子来说很容易,但对语言模型来说却很难,主要是由于数学和语言混合在一起。这类问题只是开始,当前思维链的前沿科研工作已经转向更有难度的问题,例如高中、大学,甚至是国际数学奥林匹克问题。 加利福尼亚大学洛杉矶分校(UCLA)近期的一篇论文发现,ChatGPT似乎展现出了类比推理的能力。 什么叫类比推理?推理分三种,包含演绎、归纳、类比。“类比推理通常被视为人类抽象和概括能力的典型能力。在广泛的问题类型中,ChatGPT达到或者超越人类水平...显示出这种零样本类比推理的能力。” 然而,ChatGPT的推理能力因其对世界缺乏物理理解而受限,因为它仅仅依靠文本输入,缺少视觉(图像和视频)、声音、嗅觉等多模态数据输入。文本对世界的物理描述是有限的,比如你很难通过文字描述清楚一间屋子里不同物品的位置具体,相反,看一张关于这间屋子的图片,物品的位置信息就一目了然。 听说GPT-4将于2023年发布,届时会加入视觉等多模态数据输入,这将有望进一步提升它的智能。 ▍对于ChatGPT能否成为“人类大脑”或通用人工智能,人们持有巨大争议 目前,针对ChatGPT是否能够变成“人类大脑”或者通用人工智能(AGI),争议还非常大。Yan Lecun是深度学习的三巨头之一,他也是Meta(原Facebook)公司的首席AI科学家。他认为机器和人类不一样,人类会在心智里面构建一个虚拟世界,进行推理和模拟,这点目前机器做不到。 著名语言学家乔姆斯基在2019年的一次采访中提到,深度学习更偏工程,有点像推土机,可以使用,但它没有能力告诉你人类语言的任何事情。(注:ChatGPT这类语言模型可以输出很精彩的文本,但是我们没有确凿证据证明它真正掌握了语言的规律,当然也有可能是它掌握了规律,但人类无法理解。) Kyle Mahowald等学者认为,“擅长语言” 未必 “擅长思考”。虽然人类的语言和思想是不可分离的,但专⻔处理语言的人脑区域,与负责记忆、推理和社交技能的人脑区域是分开的。因此不应该对语言模型有过多期望。 Kyle Mahowald提到了一个GPT-3没能理解的失败案例:怎么把沙发放到你家屋顶上。 就像我们在上文提到的,屋顶、沙发、起重机等更偏世界的物理知识,对于人类来说,很容易就想到用各种办法把沙发放到屋顶上去,但你很难让ChatGPT理解这样的操作思路。这个例子也说明世界物理知识的输入,特别是视觉等多模态数据输入的重要性。 03 背后的技术和发现很精彩,也还有很多发展空间 讲完ChatGPT究竟是什么,我们再来讲一下背后的技术。 我们在上文提到,ChatGPT相当于用“文字接龙”这样简单的技术原理来训练和使用语言模型,从而实现跟人类的高质量智能文本对话。这个技术原理,理论上是有升级和改善机会的,从而可能达到更好的效果。 在神经网络参数量方面,业界有人认为有优化空间,例如是否可以用参数量较小的模型达到同等效果。2048个token文本输入窗口的设计及计算机制,也可能有优化空间。例如当前有人试图让ChatGPT写推理小说,但推理小说里面的推理线索往往不易察觉且距离较远(例如好几个章节之前的一个小线索),这个距离远远超出2048个token文本的窗口,如何把当前窗口之外的知识信息容纳进来,也存在优化可能。 整体而言,作为底层算法模型的Transformer在2017年6月才诞生,现在还处在发展早期,在快速迭代和改进完善之中,应该还有很多发展空间。 此外,前面提到的多模态数据输入,会给GPT-4带来什么样的能力涌现和性能提升,也是业内人士和群众翘首以待的。 ▍人类可以从ChatGPT中学到什么关于语言的规律? 在对人类语言的探索上,ChatGPT比以往的任何产品都走得更远更深。我们人类可以从ChatGPT身上学到什么? Stephen wolfram这名科学家认为,人类语言可能没那么复杂,只是因为我们人类没有能力理解和掌握其背后的规律;而ChatGPT用基于神经网络的算法,成功解码了人类语言的本质。 据OpenAI公开的GPT-2的论文,GPT-2的训练数据是纯英语文本(做了非英语文本过滤)。即便如此,它还是显示出一些多语言能力,并且展现出非常出色的法英互译能力,尽管只是接受了10MB左右残留的法语文本训练数据。 这个现象引发了人们的思考,当前人类在语言学习方面花费大量的时间和精力,这个学习效率是不是有提升的空间?我们能不能向语言模型学习,更加有效率地学习人类语言? ChatGPT在生成文本时,是每次选择一个词,这个词是在语言模型给出的概率表中做出的选择。当前科研人员的发现是,如果每次都选择概率最高的词汇,理论上是最优解,最后呈现却往往是一篇非常普通的文章;如果不是每次选择最优解,例如随机选择排名稍微靠后一点的,却有更大机会生成一篇精彩文章。这也是个有意思的未解之谜。 以前,我们可能认为创作一篇散文或者一首诗,背后是人类精心的构思和创造。但对于AI而言,创作意味着概率和选择,我们认为的精彩文章创作原来只是AI枯燥的选择过程而已。由ChatGPT反观,可能人类对语言本身的奥秘还知之甚少。 ▍语言特征空间的单词分布 GPT把文字向量化了,建立了语言的高维特征空间,也称为隐含空间(Latent Space)。 GPT-2中每个词是一个768维的向量,GPT-3中每个词则是12288维的向量。每一个维度代表着一个属性,相当于GPT-3用1万多种属性,来描述人类语言中的词汇特征。 Stephen wolfram试图打开人类语言的特征空间,来观察其中的规律。他选择规模较小的GPT-2的特征空间,把它映射到人类比较容易理解的二维空间,从中发现了许多有意思的现象。比如,crocodile鳄鱼 和 alligator短吻鳄 离得很近,苹果跟梨聚在一起,这个可能容易理解。有趣的是,词汇之间的关系,还能从向量加减操作中反映出来,比如皇帝(King)的向量减去男人(man)的向量,再加上女人(woman)的向量,就变成了女皇(Queen)的向量。 另外,他还试图在GPT-2的语言特征空间中,寻找每次生成一个句子的游走规律,我们能从上面这个图片中,看到GPT-2是怎么在768维度的空间中游走并陆续做出下一个词的选择,但是很遗憾他还没有找到其中的规律。虽然从高维映射到二维中丢失了很多信息,但是未来如果能结合多维空间中的向量,我们可能会发现更多关于语言的规律。 ▍Transformer神经网络算法架构及注意力机制 2017年6月,Google发表了非常著名的Transformer论文,论文标题是《Attention is all you need》,意思是说你只需要注意力机制就足够了。 图片来源: 知乎@雅正冲蛋 Transformer神经网络算法架构的框图如上,如前文所述,左边部分是编码器,右边部分是解码器。Google研发的BERT用的是编码器,而OpenAI的GPT系列用的是解码器。 在AI领域,有四大类神经网络算法,包括MLP、CNN、RNN、Transformer。MLP是多层感知器,CNN是卷积神经网络,RNN是循环神经网络。 Transformer是最新的算法模型。在一些场景中,它正在逐渐替代CNN和RNN。Transformer的特征提取能力比较强,擅长长序列处理、并行计算、多模态处理等。Transformer的注意力机制有点像人一样,选择性关注,因为资源有限,只会关注最重要的事情。 Transformer已经被广泛应用在自然语言处理、计算机视觉以及生物科技等领域。生物科技行业用来预测蛋白质三维形状的Alpha Folder算法就是基于Transformer算法模型来做的。 ▍哪个模块是GPT-3储存智能的地方? GPT-3模型发布时,OpenAI团队发布了论文《Language Models are Few-Shot Learners (语言模型是少样本学习者)》。 上图是GPT-3模型的框图,它基本上跟Transformer 的右边部分的解码器是类似的。无论是预训练还是推理(做任务),都是从框图的最底部输入前面部分的文本(GPT-3模型最大的长度是2048个token),然后经过12次运算,从Text prediction输出下一个词概率预测(Task Classifier是微调训练分支,在此不详述)。 一个有意思的话题是,GPT-3用1750亿个参数,去学习接近5000亿单词的文本,显然它不是简单地把3个单词存在1个参数中去,而是大抵掌握了一些语言规律且抽象了某些知识和能力。那么,问题来了,这些规律、知识和能力到底存在哪些地方呢? 有学者认为,1750亿参数主要集中在框图中的注意力处理层和前馈网络层,前者的值是动态计算的(每输入2048个token,就重新计算一次),它们是数据相关的动态权重,因为它们会根据数据动态变化。而前馈网络层的权重是随着训练过程而缓慢变化的,因此,有学者猜想在前馈网络层中存储着GPT发现的语言规律、知识和能力等,因为要经过12次运算,运算次数越靠后存储的信息越抽象。 Stephen wolfram把GPT-2的某个前馈网络层存储的768*768维度的权重参数矩阵提取出来,压缩到64x64尺寸,就形成了如下一张神秘的图像,代表着GPT-2总结的神秘的人类语言编码规律及其他一些知识和能力的一部分。很好奇什么时候科学家可以逐步解密其中的部分内容,相信对于人类提升自我能力有好处。 图片来源:writings.stephenwolfram.com 04 未来,ChatGPT能否进化出自我意识? 和AI相比,自我意识和自由意志可以算作是人类最后的堡垒。 但是有一种观点认为,人类其实没有所谓的自由意志。人类有两个自我,一种是体验自我,另一种是陈述自我。体验自我,负责相对“机械”地解读信息、作出决策;陈述自我,则负责对体验自我的决策进行解释和表述,有时甚至会虚构故事来“欺骗”我们自己。所谓的自由意志,不过是陈述型自我给自己编的一个故事而已。 一些科学家和学者认为,理论上,我们可以构造出一个自我模拟的自指机器(Self-referential Machine),让它也具备两套体系,一个负责执行算法,另一个则专门负责对自我进行模拟(描述,或者可称为在内嵌虚拟世界中模拟自我)。这种机器会表现得就“像”一个具有自我意识的系统,以至于我们可以用这样的系统来定义所谓的“自我意识”。在古代欧洲,有一种传说中的衔尾蛇,能够自己吃自己,实现持续进化。后来,有人提出哥德尔机( Gödel Machine)的设想,认为只要程序能够模拟自身、改造自身,那么我们就可以将其称为具有自我意识的。此外,还有Quine程序结构、克莱因Kleene第二递归定理等也提出和支持了与之相似的假设。 图片来源:维基百科 我们很难预料,未来机器是否能进化出自我意识。 05 生成式AI领域的其他进展 需要指出,当前讨论的生成式AI,跟之前的分析式AI是有较大不同的。分析式AI的主要能力是分析,例如:数据分析、趋势预测、商品推荐、图像识别等,而生成式AI主要的能力是创造,例如:写诗、绘画、设计产品、编写代码等。 当前除语言模型外,生成式AI领域的其他进展还包括图像生成模型等等。未来,多模态(文本、图、视频等)对齐、融合、理解和生成等方向的进展,意义也非常重大。 关于图像生成模型,不得不提的是扩散模型(Diffusion Model)。它主要解决通过文本生成图像及其他媒体格式的难题,业内知名的扩散模型包括:DALIE2、Stable Diffusion等。 图片来源:Denoising Diffusion Probabilistic Models 06 生成式AI相关的6点创业思考与建议 2022年,大语言模型爆发。据统计,2022年,平均每4天就有一个新的大语言模型问世。 生成式AI技术也在持续引发人们对一些知名的模型层平台和应用的访问,数据增长很快,投资火热。2019 年至2021年期间,流向生成式AI业务的资本增加了约130%,其中文本和写作增长630%、图像增长400%、数据增长 370% 、音频/视频增长350% 。 图片来源:A16Z 上图是投资公司A16Z总结的生成式AI的行业堆栈。底层深蓝色的部分是基础硬件和云平台,中间蓝色的部分是模型层,再往上浅蓝色的部分是应用层。 在应用层,有的创业公司自身只做应用,模型能力则是调用外部的;还有一类叫端到端的应用模式,它会自己做模型,但一般不做大模型,或者在其他大模型基础上微调出自己的模型。 在模型层,有开源模型和闭源模型。深蓝色部分的Model hubs是用于模型存储和训练的第三方平台。 当前应用层的增长比较快,主要是由AI赋能的新型应用案例所驱动,主要集中在图像生成、文案写作和代码编写,三个类别各自的年收入已超1亿美元。 关于生成式AI的创业,我有6点思考和建议: 第一,目前,与AI相关的科研、工程、产品和商业化,都在同时快速迭代,变数很大。这个过程中,会出现不同的技术分支和业务路径,如果选错了技术分支和业务路径,再掉头就很麻烦。这就需要创业团队既懂技术又懂业务,在创业初期努力做出正确选择。 第二,对创业公司而言,从应用层或者端到端的应用层切入,可能是相对能降低风险的做法。模型层有少量机会,但不一定适合大部分的创业者。第三,应用层在做商业模型设计的时候,要警惕模型层的边界。 以Jasper公司为例。2020年在GPT-3模型基础上,Jasper衍生出付费商业文本写作的商业模式。到了2022年底,ChatGPT向用户免费开放,给Jasper带来较大的压力。尽管OpenAI未必会以商业文本生成作为自己的主要商业模式,但它平等赋能了入场的其他竞争者。Jasper需要展现出有竞争力的技术积累与业务纵深,才能稳住脚跟。 第四,把AI技术应用到产业场景,可分为新模式和旧模式改造两类方式。新模式是指创造之前没有的全新的应用场景,旧模式改造则指在现有产业场景里用AI技术来改造部分环节,或者团队带着深度行业认知和新的AI技术在成熟的产业场景中创业。新模式和旧模式改造,都存在巨大的机会。 在峰瑞已投企业中,有好几家企业在垂直产业的场景中做业务创新。比如线上心理咨询平台阁楼、短视频及直播SAAS服务企业特看科技、线上健身私教平台BodyPark,都在积极使用生成式AI来赋能自己的业务。本周六(3月11日),我们将邀请这3家公司的创始人来分享他们的探索和发现,欢迎参与。 第五,AI还面临科研知识快速溢出的问题,因此找到自己的壁垒很重要。创业公司一定要想清楚自己未来的壁垒在哪里,比如到底是数据壁垒、工程壁垒(例如模型微调)、场景壁垒,还是规模壁垒等等。在应用层创业,仅依靠外部模型层提供的能力,是无法形成壁垒的。 第六,应用层的创业,应该是“技术为先、场景为重”。 “技术为先”,是指虽然通用AI技术未必是你的核心壁垒,但团队一定要懂技术,才有能力思考如何更早更好地把技术应用到合适的应用场景里,做出好用的产品。 “场景为重”,意味着最后的产品和业务需要找到合适的落地场景,建立自己的商业模式,并在场景里形成自己的核心竞争力。 07 生成式AI行业的未来格局展望和猜想 最后来聊聊对AI行业格局的未来展望和猜想。这个部分我参考了奇绩创坛陆奇博士之前的一个思考框架。 ▍以AI和大模型为中心的新IT 新的硅基硬件产业:硅基产业架构和集合可能迎来新的发展机遇(例如:新的计算芯片及周边技术和产业等)。 新的软件和云服务体系:算力、模型和数据的云服务、基础软件、ML&Dev Ops、人机互助编程工具等。 ▍新的基础智能终端设备:智能传感器、新型手机等 未来的智能终端会越来越智能,最近苹果公司官宣支持Stable Diffusion图像生成模型在iPad等终端上运行,也有工程师把经过裁剪的Stable Diffusion应用在
iPhone
上运行起来,可以预见以后我们的手机美颜和照片生成可以达到何等出神入化的境界。 此外,当前的翻译软件技术,在语义理解方面还是比较浅,翻译质量差强人意。如果可以把类似ChatGPT这样的语言模型能力嵌入到智能终端中去,随着文本和语音的实时翻译成为可能,跨语言交流将变得很方便,这对于提升人类之间的交流效率意义重大。 ▍围绕内容创作展开的产业 文、图、视频、3D等各种媒体格式的AI内容创作工具,是当前可以看到创业机会较多的新产业。 以ChatGPT为代表的语言模型的文本生成技术,和以扩散模型为代表的图像视频多模态生成技术,可能会对内容产业产生深远的影响。从PGC到UGC,再到如今的AIGC,内容领域会有更多新变化与新玩法。 从媒体行业发展情况来看,当前头部的内容媒体平台比如抖音快手B站是所谓的Web2.0平台,普遍采用UGC方式为主来生产内容,但是随着AI生产内容(AIGC)的出现,AI可以生成大量优秀内容,成本较低、效果精良,而且甚至不乏创意,这个情况下内容媒体平台和行业就有可能出现较大的变化。 ▍围绕语言模型展开的产业 在这个领域,新的机会可能包括:语言学习范式改变,重塑跨语言沟通方式,更友好的人机界面等。 其中特别值得一提的,是语言学习范式的改变。如前文所述,如果我们可以打开语言模型,从中寻找到语言学习的规律,说不定可以帮助我们更有效率地学习语言。事实上,OpenAI投资了一家韩国的英语学习APP叫Speak。从有限的公开信息来看,这家公司未来的产品是一个语言学习助手,或者叫做虚拟语言老师——借助语言模型的能力和发现的语言规律,去帮助人们更好地学习外语,而且成本极低。 跨语言沟通的技术目前还不成熟。如前面所说,如果我们能够把语言模型加载到智能终端,可能会极大改进跨语言沟通的能力。 因为语言模型足够强大,未来我们的人机界面,会采用更友好的自然语言人机界面,无论是跟APP对话还是跟智能硬件对话。 ▍围绕思维模型展开的产业 不妨畅想一下,更聪明的软件(或机器人)、科研服务、 “知识工程”、“世界大脑”等。 当前的软件产业,即便有AI的加持,通用性和智能程度还是不尽如人意的,大多数情况下只能做一些特定的任务,只能成为人类的效率助手;随着更加通用的AI能力出现,软件也可以像人类一样思考和做事,可以想象软件就可以帮助人类承接较为完整的任务了。 如果AI可以发展出接近人类的思维能力,它也许可以成为人类科学家的科研助手,因为AI可以不知疲倦,且可广泛使用。当前,我们很难想象AI可以达到人类顶尖科学家的水平。打个比方,你让它去证明下哥德巴赫猜想,应该还是很不现实的。当然也有其他可能,如前文所述,如果AI程序可以实现自我优化,具备迭代自己的算法和技术的能力,相信它的智能会很快赶上来。 如果我们展开想象,就可以有更多的可能性。例如“知识工程”,如果把人类的知识建模,然后让人类以某种方式可以调用或者学习,那么就不用经过“痛苦”的学习过程。“世界大脑”,是指规模极大的思维模型,它可以帮助我们执行各种重要的计算和思考。不过,如果真的发展到这个地步,可能离电影《黑客帝国》里边的Matrix就不远了。 ▍赋能人类,深入改变各行各业(特别是知识工作者) 语言是人类最主要的沟通方式,是知识和思维的主要载体;而深度思维是人类的高阶能力,也是人类不同于其他物种的最重要的能力。如果AI掌握了这两种能力,就基本具备了在某种程度上赋能或替代一部分人类知识工作者的可能。 类似于自动化生产制造设备赋能传统工业,各类AI模型和应用软件也将有机会更好地赋能各行各业。但是不同于制造行业,大批量使用的软件,其边际使用成本是非常低的,而且它很聪明、善学习、会思考、会交流,应该会有大量的应用场景有待开发。这里边有非常多的创业机会,也会给各行各业带来新的发展动力。 08 写在最后,为什么AIGC不会是短期风口? 首先,ChatGPT是语言模型领域的重大进展,鉴于语言对人类沟通和思维的重大意义,语言模型本身具备很强的通用性,以及人类可以通过研究语言模型获取语言及知识的学习规律并得到效率提升,这些都会持续带来长期的创新机会。 第二,AI在思维机器这个方向上还有更远的路可以走。例如,如果AI能够实现良好的多模态信息输入,增加对物理世界的理解,可能可以“涌现”出更多的智能。这个方向的任何进步都意义重大。 第三,与AIGC相关的底层技术原理和算法都还处在发展早期,未来还有很长的迭代和优化机会。 一切,才刚刚开始。 来源:金色财经
lg
...
金色财经
2023-03-10
供应链转移
iPhone
“印度制造”时代开始?苹果和富士康成功游说卡纳塔克邦通过了新立法
go
lg
...
卡纳塔克邦是印度科技产业的中心,上周通过了一项工厂法修正案,允许 12 小时轮班,高于之前的 9 小时限制;放宽了女性夜间工作的规定;最长工作时间限制在每周 48 小时,还将三个月内允许的加班时间从之前的 75 小时扩大到 145 小时。中央政府和印度各邦,尤其是印度南部各邦,都在为电子和其他行业的投资者提供激励措施,以吸引寻求多元化发展的制造商离开中国。
lg
...
林沐
2023-03-10
上一页
1
•••
340
341
342
343
344
•••
397
下一页
24小时热点
突发重磅!以色列袭击伊朗 德黑兰传巨大爆炸声 金价飙升近25美元 油价暴涨、美股期货重挫
lg
...
美联储9月起将连续降息!初请失业金高位持稳+PPI符合预期
lg
...
【比特日报】以色列突然动手引爆中东!比特币大跳水失守10.3万,多单爆仓超十亿
lg
...
中国经受住关税“过山车”,但经济势头恐放缓!下周盯紧这些数据
lg
...
李嘉诚港口交易最新转折!中资企业传商谈加入出资财团
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
34讨论
#链上风云#
lg
...
109讨论
#VIP会员尊享#
lg
...
1989讨论
#CES 2025国际消费电子展#
lg
...
21讨论