全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
比ChatGPT更可怕!赵长鹏上线AI绘图机器人 “铸造额度秒杀、系统超载宕机”
go
lg
...
) Bicasso类似于DALL-E或
Midjourney
等AI艺术平台,用户可以在其中输入创意提示以生成独特的图像或上传图像以供工具进行适配。然后,用户可以在币安的原生BNB链上将他们的图像铸造为NFT。 随着生成艺术技术继续推进Web3,围绕NFT和人工智能的对话在过去一年中一直在上升。去年,生成艺术NFT收藏以高昂的价格和不断增加的交易量度过了加密冬天。 美国专家示警:AI可能制造“大量失业浪潮” ChatGPT等最新的AI技术陆续更新,让人担心它将消灭数百万工人的工作,无论是广告撰稿人、华尔街交易员、销售人员、基本计算机代码编写者还是记者。现如今再有Bicasso的出现,艺术、设计与画家等工作也深受威胁。 尽管许多劳动力专家表示,对ChatGPT和其他AI技术将导致失业率飙升的担忧被夸大了,但他们指出了对人工智能的另一种担忧,即它会通过创造新的亿万富翁科技大亨的浪潮同时将许多工人赶出了薪水更高的工作。 与之前的许多革命性技术一样,AI很可能会消除工作岗位。但是专家们认为,正如过去的情况一样,除了增加许多现有工作岗位之外,人工智能可能会通过刺激创造新工作岗位来抵消其中的大部分影响。最大的问题是:什么样的工作? 哈佛大学劳工经济学家劳伦斯·卡茨说:“AI将消灭很多当前的工作,就像过去所有的技术一样,但我没有理由认为AI和机器人不会继续改变工作组合。问题是,工作组合的变化是否会加剧现有的不平等?人工智能是否会提高生产力,以至于在取代大量工作的同时创造新的工作并提高生活水平?” 麦肯锡全球研究所劳动力市场研究负责人Anu Madgavkar估计,美国1/4的工人将在工作中看到更多的AI和技术。她说,50-60%的公司表示他们正在从事与人工智能相关的项目。Madgavkar提到说:“因此,人们将不得不以一种或另一种方式学习与AI打交道。” 虽然过去几轮自动化对工厂工作的影响最大,但Madgavkar表示,AI对白领工作的影响最大。“它越来越多地进入基于办公室的工作,以及客户服务和销售,”她说。“它们是自动化采用率最高和流离失所最大的工作类别,这些工人将不得不使用它或转向不同的技能。” 一些劳动力专家表示,人工智能和其他新技术对中层、白领工作的伤害要大于对低薪、体力密集型工作的伤害。麦肯锡的 Madgavkar解释,人工智能或机器人很难完成看门人的工作。她说,在餐饮服务领域,新技术可能能够接受客户订单,但“我们不会看到许多将食物带到特定餐桌的小机器人”。 在律师事务所,AI可能会通过准备商业合同的初稿来消除一些律师的工作。但人工智能也可能使律师助理能够监督合同草案的准备,而责任的增加可能意味着律师助理的薪水更高。 霍华德大学经济学教授、美国主要劳工联合会AFL-CIO首席经济学家威廉·斯普里格斯(William Spriggs)提到说:“如果你提高工人的生产率,工人就应该赚更多的钱。” “公司不想讨论分享这些技术的好处,他们宁愿进行讨论以吓唬你这些新技术。他们想让你承认,你只是很感激有一份工作,而且你会付给我们花生。” 他指出,当自动化浪潮从1950年代到1970年代席卷汽车行业时,“UAW对福特和通用汽车说,我们的生产力要高得多,你们的利润也要高得多。结果,工人们得到了更多的钱。” 麻省理工学院经济学教授David Autor对ChatGPT和AI做出预测持谨慎态度,“存在巨大的不确定性”。 麻省理工学院计算机科学与人工智能实验室交互式机器人小组负责人的麻省理工学院教授朱莉·沙阿(Julie Shah)表示,她与雇主合作,让他们使用人工智能和机器人来“增强和提升员工,而不是取代他们”。 她说,一些雇主希望使用机器人打造一个没有任何人类工人的熄灯工厂,而其他公司则希望机器人与人类一起工作以提高效率,并让人类工人在场提出未来的创新想法。 她指出了一项对引进机器人的法国大公司的研究,这些公司增加了整体就业,即使它们的国内竞争对手减少了劳动力。她还引用了一项对加拿大公司的研究,这些公司开始使用机器人并最终减少了中层管理人员的数量,同时增加了生产工人的数量。她也提到,在美国一些公司采用了机器人并提供了更高的工资,但整体工作岗位却减少了。 “这些技术不会导致一个未来,而是会导致许多可能的未来,”Shah 说。 哈佛大学的卡茨也担心人工智能对收入不平等的影响。“随着许多任务的自动化,它可能会继续降低劳动力在收入中的份额。” 卡茨说,一个大问题是,如果人工智能带来重大的生产力增长,谁将分享收益,以及如何分享这些收益。“通过再分配政策需要多少?” 他问。“如果它真的很好并且大大提高了生产率,即使工人得到的蛋糕份额较小,他们最终也可能获得更高的收入。” 但鉴于目前的情况,这些收益不太可能惠及美国的工人。“在这个过程中让工人及其代表拥有更强的发言权,是适应这些变化的一个重要因素。这种情况发生在拥有更强大的工会和工作委员会的国家,这是美国落后的领域,”卡茨说。
lg
...
小萧
2023-03-02
一文了解AIPad:专注于人工智能项目的加密Launchpad
go
lg
...
AI 应用程序(特别是 GPT-3、
Midjourney
以及最近的 ChatGPT)的迅速和扩散,以及围绕该技术未来的巨大热议和兴奋浪潮引起大型科技公司的极大兴趣。可以理解的是,区块链 AI 领域出现了一些溢出效应。 因此,绝大多数已建立的区块链 + AI 项目在最近几周表现良好——尽管大多数仍远低于其历史最高值。例如,与 2021 年 2 月的历史高点相比,Graph (GRT) 仍下跌了 90% 以上。 有一些人认为,最近的这种势头仅仅是昙花一现,而不是由于这些项目的基本效用和价值发生了变化。 同样,虽然许多项目声称具有人工智能功能,但许多项目仍在开发中,或者只是将人工智能用作流行语。因此,在投资任何项目之前进行调查和了解清楚项目就变得非常重要。 人工智能驱动的加密项目 AI + 区块链领域目前由少数几家大公司主导——其中最大的公司市值超过 1 亿美元。目前,市值排名前 100 的加密货币项目中,只有三个具有 AI 元素。一些流行的人工智能驱动的区块链加密项目包括: The Graph (GRT) 目前市值最大的人工智能加密项目,The Graph 是一个索引来自广泛区块链数据的平台。该平台使用 AI 更有效地索引和检索这些数据,有助于为下一代去中心化应用程序 (DApps) 提供动力。 The Graph 最近向 Semiotic AI 提供了 6000 万美元的资助,后者现在进行研发以探索如何使用 AI 来增强 The Graph 的功能。 SingularityNET (AGIX) SingularityNet 是首批通过为 AI 服务提供去中心化平台来整合区块链和 AI 技术的项目之一。它允许 AI 开发人员和企业将他们的算法和模型货币化,同时使最终用户能够在去中心化和安全的环境中访问和使用 AI 服务。 Ocean Protocol (OCEAN) Ocean Protocol 是一个去中心化平台,可以为人工智能 (AI) 和机器学习 (ML) 应用程序实现安全和透明的数据交换。它利用区块链技术和智能合约为数据提供者提供一个安全的环境,使他们能够通过数据获利,同时保持对其使用的控制。 Fetch.AI (FET) Fetch AI 是最著名的应用 AI 和区块链的项目之一,Fetch AI 使用这两种新兴技术为一系列自主代理提供支持——可用于改进和扩展各个行业。该平台旨在创建一个开放且可互操作的网络,在该网络中可以轻松访问数据和服务并将其货币化,从而有助于推动新的经济增长和商业模式。 Numerai (NMR) Numerai 使用人工智能为分散的众包对冲基金提供支持。来自世界各地的人工智能模型在加密的金融数据上进行训练以做出预测。然后将这些模型组合起来做出在全球金融市场上交易的预测。网络参与者通过代币奖励系统受到激励,从而实现民主分配利润。 至少100 多个区块链项目现在在一定程度上利用人工智能。其中一些在一开始就专注于人工智能,而另一些最近将人工智能纳入了他们的路线图或即将推出的应用程序。 最近整合人工智能的一些流行的项目包括:TRON、PRIMAL、XANA等。 什么是 AIPad? 目前,许多最大和最成熟的传统人工智能公司都是私有的——只有投资者能够参与他们的私募融资轮,否则很难接触到他们或参与其中。 与此同时,人工智能驱动的区块链项目往往被风投和知名天使投资人垄断,他们能够在种子期和私募阶段进行投资,以获得最好的条款和价格。 这使得散户投资者除了在现货市场上市后购买或通过衍生产品或加密货币指数基金对其进行投机外,投资早期区块链 AI 项目的选择有限。 为了帮助实现这些新投资机会的去中心化,Launchpad BSCPad 和 GameZone 背后的同一个团队创建了AIPad。 新的Launchpad专注于建立在区块链技术之上的 AI 项目,并使用基于层级的分配模型来允许 AIPAD 代币的持有者参与这些项目的 IDO 和私募轮次。除了为 AI 项目托管 IDO 外,该平台还利用 OpenAI 的聊天机器人技术为访问者和用户提供支持。 据了解,AIPad(官网:https://www.aipad.tech/ )计划在平台上发行三个 AI 项目,未来将致力于让每个人都能接触到人工智能(AI)并对其产生影响。 即将推出的人工智能加密项目 区块链行业发展迅速。每当一项新技术展现出巨大的潜力和能力时,开发人员和企业家通常会迅速创新并开发新的商业理念和用例。 因此,下一代人工智能项目一直在开发中,其中一些最突出的项目包括: CryptoGPT 即将推出的 ZK layer 2 ,可让用户快速轻松地通过数据获利。该平台引入了数据胶囊 NFT 的概念,它们是链上数据存储库,可以使用新数据进行更新,并通过 AI 开发请求轻松货币化。该平台将为用户提供一个简单的启动器,可用于捕获和存储来自各种应用程序的数据,并将这些数据变现。 AI Arena AI Arena 自 2021 年开始开发,是一种基于以太坊的应用程序,它使用人工智能使 NFT 更具能力和生产力。该游戏以玩家拥有的 NFT 角色为中心,这些角色会随着时间的推移通过模仿人类行为而进化,然后在竞技场中相互战斗。该游戏目前正在 Arbitrum 上构建。 Bittensor Bittensor 希望将去中心化的 AI 市场系统引入 Polkadot 生态系统。该平台旨在通过提供分布在区块链上的机器智能的开源存储库来帮助促进人工智能的商品化。 HyperCycle 团队来自 SingularityNET 的团队,HyperCycle 是一个第 2 层区块链,专为高度可扩展和可访问的去中心化人工智能应用程序而设计。它将使用 Cardano 的 Hydra 侧链框架启动,并利用 SingularityNET 的信誉证明 (POR) 系统和 TODA 数据结构。 PLAI Labs PLAI Labs 自称是“下一代社交平台”,旨在利用人工智能、区块链技术和游戏化来打造全新的社交游戏体验。该公司正在创建一个新平台,将战斗和交易游戏玩法融入一个长线剧情中。 Rejuve Network 该项目旨在利用人工智能收集、分析和评估用户的健康数据,以提供基于研究的健康长寿建议。它将使用人工智能对人体进行机械模拟,人工智能代理和研究人员可以对其进行研究和测试,以产生健康建议和预防措施。 来源:金色财经
lg
...
金色财经
2023-02-27
AIGC拯救虚拟偶像?
go
lg
...
ion、DALL·E、NovelAI、
Midjourney
等AI作画工具为心爱的虚拟偶像创作插画甚至是cosplay,丰富衍生的图片内容。不过,无论是插画和cosplay,都可以由真人完成,所以此类创作虽然能让粉丝叫好,并没有一种让偶像复活的惊喜感。 与此同时,SVC歌声音色转换技术开始在虚拟偶像二创圈流行,包括diff-SVC、so-vits-svc在内的多个开源技术项目得以应用。这些技术通过深度学习,根据人类声音合成AI模型,并转换原有人声,生产出和虚拟偶像声音十分相似的音频作品。技术的进步让虚拟偶像的二创跨出了一大步,不再局限于视觉。 近几个月,基于凑·阿库娅、鹿乃、珈乐等虚拟偶像角色进行仿真二创的AI投稿作品陆续出现在国内外的视频网站,这些以AI虚拟偶像名义发布的作品让粉丝们激动不已,甚至有珈乐(虚拟偶像女团A-SOUL成员)的粉丝在珈乐AI的音频投稿下再一次打出了这样一行字:”她只存在了一年半,接下来我要给她完整的一生。“ 以前连粉丝都觉得是在玩梗的言论,如今有希望通过AIGC让其成为现实。 AIGC续命虚拟偶像 2022年5月,虚拟偶像女团A-SOUL成员珈乐的中之人33和公司解约,使得珈乐进入休眠,此后A-SOUL一直以四人团的形式运营,这让不少珈乐的唯粉倍感失落。后来,33以真人身份重新开播,熟悉的声线让不少人从珈乐粉转为了3粉。但也有珈乐的粉丝觉得自己还是喜欢那个紫头发大眼睛狼耳朵,有着偶像化运营的虚拟形象,并不是形象的扮演者。一时间,围绕着中之人和虚拟形象之间的争议不断展开,随着33的直播越来越有个人特色,珈乐粉纷纷切割,重新回看起过去珈乐的作品和直播切片。 AI珈乐演唱A-SOUL二创名曲《枝江》,UP主:存梦P 但总看历史作品对于粉丝而言太不过瘾,于是有一批基于UTAU引擎的珈乐二创音乐作品横空出世,虽然也能成为一部分珈乐粉丝的”代餐“,但老旧的UTAU引擎生成的人声电音过重,存在不够真实的缺点,让不少粉丝无法接受。粉丝是想让心爱的虚拟偶像变得更加真实,距离更近,但和中之人相比,UTAU并不能给到大多数粉丝替代感。在2022年底,Diff-SVC、so-vits-svc等项目陆续在开源社区发布,给粉丝还原珈乐的声音提供了更好的选择。 已经超过2300位技术宅收藏这一AIGC项目 和UTAU需要大量原音生成声音数据库,再利用MIDI谱面重新生成对应歌曲的过程相比,基于深度学习的Diff-SVC(简称ds)、so-vits-svc(简称svs)明显要先进得多:一方面ds、svs的准备成本比较低,用户只需要准备数十分钟的角色语音、歌声文件交给svs进行深度学习,就能生成对应角色的AI声音模型,同时免去了音频调校的工序,极大地降低了创作者的门槛;另一方面ds、svs的合成效果更好,因为音频基于SVC技术,能让一些歌手原本的唱法得以保留并直接转换,生成的音频更贴合收听者。 因此,这类AIGC技术不仅让声音二创变得更加真实,还大大降低了声音类二创的难度指数。想为珈乐等虚拟偶像创作声音内容的创作者,如今只需要一个成熟的训练模型,一首唱好的歌,加上一张好显卡,就能得到由喜欢的虚拟偶像演唱的翻唱音乐。 整合包的出现让AI翻唱的制作更简单了,UP主:夜歩空 初音未来、洛天依等V家粉丝最近也吃到了AIGC带来的内容红利,由于VOCALOID热度降温等原因,V家相关的非音乐内容创作开始变少,知名插画师近年很少再为爱发电地为这些”过气萌二网红“创作作品,这让不少MikuFans、锦依卫只能眼馋其它虚拟偶像的二创。但AI作画工具的兴起,让技术宅可以自己动手丰衣足食,一边靠AI创作,一边看着自己的作品流下老二次元的眼泪。 在2022年之前,通过主流的AI作画工具生成一张二次元风格的图片还需要大量的参数,且生成的AI作品质量极为不稳定,需要碰运气才能生成一张能看的图片。但在2022年10月,基于Stable diffusion模型的NovelAI发布,改变了这一切,这个擅长生成二次元风格插画的AI作画工具让偏爱二次元风格的AI画师们狂喜,NovelAI不仅提供了传统的文字转图片的方式,还有着基于已有图片反推文字,并生成风格化图片的功能,这让AI创作二次元插画的难度再次降低。 Stable Diffusion+NovelAI生成的AI珈乐插画,UP主:ppupsie 今年,随着NovelAI在个人电脑上的适配逐渐成熟,不少风格化训练模型被共享,AI算力云平台陆续上线,希望为虚拟偶像创作插画等内容的粉丝进入这一领域的门槛越来越低,AI插画作品陆续发布,不少初音未来、洛天依等V家角色的高质量AI插画、AI Cosplay甚至是AI手办模型作品陆续出现在大众视野,引发了新的议论热潮。 官方不应缺席AIGC 和民间AI创作工具使用门槛越来越低,用户操作越来越简单相比,官方在新技术工具跟进方面就显得有些掉队了。例如已经休眠一年的虚拟主播绊爱(点击回顾:第一虚拟主播「绊爱」的消失),曾在去年推出了基于CeVIO AI的声库#kzn,主张用户通过创作音乐作品的形式为绊爱IP继续做贡献。但是CeVIO AI是一款类似于VOCALOID的音频制作工具,需要创作者有一定的音乐创作基础。其中的AI功能主要为自然平滑地生成人声服务,并没有降低创作者的使用门槛。此外,#kzn的声线虽然取自绊爱,但由于CeVIO AI引擎本身的风格,仍保留有一些电子音,相关作品的听感远不如绊爱本体的翻唱。 一直在限时发售的#kzn 声库 在国内虚拟偶像行业,只有洛天依、星尘等少量虚拟歌姬推出了利用AI辅助创作的产品,其中洛天依等Vsinger和ACE Studio、XStudio分别合作推出了AI声库,可以让发声更加平滑顺畅;星尘则脱离了原本的VOCALOID引擎,转为通过自家的AI发声引擎Synthesizer V提升了原有的发声质量。对于原本的P主(音乐创作者)来说,新工具的易用性有所提升,但对想成为P主的新人而言,相关工具的上手难度仍然偏高。而虚拟主播由于普遍生存周期较短,依赖中之人以直播整活变现,鲜有可供粉丝使用的AI创作工具。 靠谱二次元(公众号ID:kpACGN)总结了当下大部分虚拟偶像都没有合适的AIGC工具原因主要有两点,一是AIGC发展速度超过预期,一些公司对AIGC领域还在观察、预研和立项,不能立即推出相关产品;二是虚拟偶像公司大多出身于文娱领域,面对更偏技术向的AIGC,纵使心有意,但追逐的难度也非常高。 《AI绘图,但是洛天依》,UP主:是瞳辉啊 从现在各个虚拟偶像二创领域的成果来看,基于已有高人气的虚拟偶像,推出定制化的AIGC工具,对于IP拥有方来说,是一件有利可图的事。首先,定制化的AIGC工具能方便创作者更准确地制作相应的AIGC产品,提升作品的综合质量;其次,定制工具可以更方便地了解创作者的创作需求,随时进行技术调整;最重要的是,经过定制的工具能有效防止AIGC常见的侵权、越权创作情况发生,规范基于自身IP的AIGC创作边界。 如果有一款好用的定制化AIGC工具面世,或许能迎来十多年前V家刚刚面世时的创作潮。回顾过去,高人气的虚拟偶像都离不开粉丝们的二创,AIGC工具能更方便地将粉丝的热情转化为高质量的二创内容,吸引潜在粉丝的关注和加入。 AIGC能否独挑虚拟偶像大梁? 在虚拟偶像行业,AIGC的故事听起来非常诱人,甚至能够完成不少”去中之人化“的工作,让虚拟偶像面向虚拟更进一步,但AIGC实际上只能带动虚拟偶像产业一小部分。 据了解,游戏公司米哈游旗下的虚拟偶像鹿鸣举办过两场直播活动,最近一次是2023年的1月。两场直播的人物发声已经通过旗下的逆熵AI解决,但鹿鸣的动作依旧依赖真人动捕,直播过程中也能发现存在运营人员引导干预的行为。而其他虚拟偶像的直播活动仍以中之人配音为主,这在一定程度上说明,寄希望于目前的AIGC技术完整地跑通虚拟偶像运作的流程,还有些为时过早。 更重要的是,对于当下火热的虚拟偶像而言,粉丝追求的并不是单一的美术、声音,而是一位有温度的虚拟偶像,这其中不仅包含着制作人、中之人的角色塑造,还包括一整套偶像化的运营策略。让虚拟人更像一个亲和的人类,才是虚拟偶像获得人气的基本,”皮魂一体“才是虚拟偶像的制胜关键。而这对于当下的AIGC而言,还显得有些难。 但对于濒临消失,离粉丝越来越远的过气虚拟偶像而言,AIGC确实可以拉她们一把,但目前AIGC能做到的,只是让这些看起来无人问津的精致虚拟小人,相对鲜活地存在既有粉丝的记忆里,完成粉丝的执念罢了。 来源:金色财经
lg
...
金色财经
2023-02-27
AI 赋予文字无限力量:“由文本生成一切”的一年
go
lg
...
一种基于文本指令创建绘图的算法” -
MidJourney
你现在看到的是文字——文字作为一种媒介,让我向你传达一连串的想法。自从人类用文字记录事物,而不再依靠记忆,我们就一直在使用一连串符号来传递信息,你可以把所有这些称为“文本”。 今时今日,以及在过去的几个世纪里,我们已经将我们对世界的知识、我们的想法、我们的幻想转化为文字。也就是说,人类的大部分知识现在都以文字的形式存在,我们也在用其他方式交流,比如肢体语言、图像、声音等。但文字是我们用于记录交流、思想和观念的最丰富的媒介,因为使用起来非常便利。 当GPT-3被输入互联网信息时,它消化了我们对周围世界的观察、我们的无聊世事、我们彼此之间疯狂的争论……,学会了在一连串符号化的人类混乱表达中预测下面的内容。 在学习我们连词成句进行交流的过程中,一个大型的语言模型会模仿(或“鹦鹉学舌”)我们如何开玩笑、安慰和发布命令。GPT-3开启了一场“革命”,在 “从文本到文本”方面表现得非常好:输入一些任务例子(如完成一个比喻)或对话开头,这个生成模型(通常)就可以学习任务或继续对话。 我们在文字的使用方式中,几乎存在一定的“普遍性”,而我们的技术只是在最近才达到这样的程度:人工智能系统可以加以整合,发掘我们使用语言的方式,从而描述其他形态。实现强大文本生成能力的技术,也能用以实现文本条件下的多形态生成。“从文本到文本”变成了“从文本到X”。 在“从文本到文本”中,你可以要求模型对一只狗进行描述。在“从文本到图像”中,你可以将该描述转化为其对应的视觉效果。文本-图像模型提供了一种现有图像生成系统所不具备的新能力。现有的模型,例如GANs,经过训练,可以在给定的噪声输入下(以及用于类别条件图像生成的类别信息)生成真实的图像。但这些模型的可控水平不高,难以达到 DALL-E 2、Imagen 等模型的高度:用户可以要求生成一只戴着太阳镜的袋鼠,站在特定的建筑物前,拿着带有特定短语的牌子。你的愿望就是算法的命令。 谷歌 Parti 生成的图片 在“文本到图像”得以有效实现之后,更多的应用随之而来:“文本到视频”是下一个热点。“文本到音频”技术已经存在。“文本到动图”和“文本到3D”技术说明了文字可以转化为其他事物。 这篇文章的主题是“从文本到一切”的一年。最近的技术发展,使人们能够以更有效的方式快速地将文本转换为其他形态。这些发展令人兴奋的,并有望在未来几年内实现大量的应用和产品。但是我们也应该记住,“文本的世界”是有局限性的,只是一些空洞的思考,描述世界却不与其发生实际互动。我将讨论时至今日的技术进步,也会思考如果文本信息的“呈现”仅仅停留在文本领域,“从文本到一切”会有怎样的局限性。 多形态终于成为现实 从技术上说,GPT-3揭开了一切的序幕。这已经被提到很多次了,所以我就简单说一下:OpenAI训练了基于transformer 架构的大语言模型。这个模型比之前的GPT-2大得多,训练的数据也多得多(1750亿个参数vs 15亿个参数;40TB的数据vs 40GB),OpenAI当时认为发布这个模型太危险了。它可以做一些事情,比如编写不那么复杂的JavaScript代码。有些人会觉得很酷,有些人会觉得一点也不酷,有些人会觉得一般般。创业公司都建立在新的最大的模型上,新闻和学术文章都在赞扬和批评新模型,美国以外的国家也在发展自己的大语言模型参与竞争。 2021年1月,OpenAI 推出了一个名为CLIP的新人工智能模型,它拥有与GPT-3类似的zero-shot能力。CLIP向连接文本和其他形态迈出了一步,它提出了一种简单、优雅的方法来训练图像和文本模型,当有人进行查询时,整个系统可以在可能的标题选择中,把图像与相应的标题相匹配。 DALL-E可能是第一个“善于”从文本产生图像的系统,与CLIP在同一天发布。CLIP在第一代DALL-E中没有使用,但在其后续版本中发挥了重要作用。由于能够根据文字提示生成合理的图像,DALL-E上了多个新闻头条。 扩散模型(diffusion model)登场 虽然一些人工智能先驱感叹,如果我们想实现“真正的”通用智能,深度学习不是办法,但“文本到图像”模型无疑适合运用深度神经网络的力量。深度学习模型中的一些互补性进展,使得“文本到图像”模型取得了进一步的飞跃:扩散模型被发现,实现了极高的生成图像质量。(参见论文Diffusion Models Beat GANs on Image Synthesis)。 DALL-E 2的发布时间距离DALL-E约一年多,利用扩散模型的技术进步,创造出比DALL-E更逼真的图像。而DALL-E 2的风头很快就被Imagen和Parti抢去——前者使用扩散模型展现了惊艳的水准,后者则摸索出了一种补充性的自回归方法来生成图像。 故事并没有到此结束。
Midjourney
是一个用于图像生成的商业扩散模型,由同名实验室发布。稳定扩散(Stable Diffusion)模型借鉴了对潜在扩散模型的新研究,可以用有限的计算资源进行训练,因为Stability AI公司选择公开该模型及其权重,Stable Diffusion的发布受到了万众瞩目。 神经网络架构的创新并不是促成以上改进的唯一原因。雅虎在2015年发布了Yahoo Flickr Creative Commons 100 Million Dataset(YFCC100M),在当时是有史以来最大的公共多媒体数据集合。最近,Large-scale Artificial Intelligence Open Network(LAION)发布的数据集更在规模上令YFCC100M黯然失色。2021年发布的LAION-400M包含4亿个图像-文本对,然后是2022年发布的LAION-5B包含50亿个图像-文本对。 值得注意的是,虽然这些数据集能够大规模地训练图像-文本模型,但它们并非没有问题。The Decoder的报告曾发现LAION的数据集包含未经同意发布的病人图像,研究人员也评论说,该数据集的质量并不纯正。如此庞大的数据集必然会有其他的伦理问题出现,OpenReview上的作者和审稿人似乎就这些问题进行了颇有见地的意见交流。 从文本到一切! 如果人工智能模型可以将文本转换为图像,那么它们可以将文本转换为视频吗?当然可以!10月份,一批从文本到视频的生成软件面市。Meta公司的Make-a-Video可以根据文本和静止图像生成视频,而谷歌大脑的Phenaki可以根据一系列构成故事的提示词生成一个连续视频。 也许更有用,或者说更令人担忧的是,这些生成模型也能胜任代码的编写。当用户注意到GPT-3可以写出像样的代码时,GPT-3开始登上新闻头条,声名鹊起。从那时起,代码生成语言模型的能力有了很大的进步。OpenAI的Codex能将自然语言转化为代码,并且许多其他类似的模型也在纷纷效仿。DeepMind的AlphaCode也能以合理的水平解决编程问题。 这些技术进步彼此追赶的速度令人印象深刻,正如Kevin Roose等人所评论的那样:“AI的发展速度如此惊人,怎么强调都不为过。我刚写完一篇关于AI惊人发展速度的文章,市场上就有了一些重大发布,包括OpenAI的Whisper(语音到文字的转录软件)和文字到视频的生成软件。” 而且AI还可以更进一步:文本也可以转化为其他媒介,包括音频、动作和3D。 而且,正如我们的同伴Jacky Liang博士所展示的,语言模型甚至可以根据自然语言指令编写机器人政策代码。 看起来生成式AI的可能性是无穷无尽的。我们只是看到了人工智能模型创造力的雏形。我预计,随着越来越强大的模型开发出来,文本将能够指导大量的发明创新。红杉资本最近发布的《生成式AI应用格局》,已经展示了许多不同的细分赛道。 在一个特定的生成赛道内,有许多可能性和商业领域可以应用这种类型的生成工具。文本生成不仅可以承担文章的写作,还可以承担平台的后期语言调整;图像生成和文本转3D工具可以为游戏、信息应用和市场营销创造各种工艺品;其他应用提供了生成文档的能力。而且,正如上图所指出的,音乐、音频和生物/化学方面的应用还没有到来。 ChatGPT和更多的“文字到文字” 即使是在“文本到文本”领域,也有海量的事情可以做:最近推出的ChatGPT在互联网上炸开了锅,基本上是因为该模型有能力以对话的形式全面回答问题。你可以要求它为你制定一个简单的锻炼计划,写一个课程大纲,建议你做什么,向你某位哲学家的作品,以及其他很多事情。 不够值得注意的是,ChatGPT的知识有严重的局限性。 事实上,如果你要求ChatGPT提供关于某个特定主题的更多细节(例如普鲁斯特关于时间性质的想法),它就会开始自己绕圈子——挺符合你对一篇高中生作文的期望。事实上,ChatGPT的存在可能会改变我们对写作技巧的某些方面的理解。 > 也许有理由感到乐观,如果你把这一切放在一边。也许每个学生现在都能立即进入更高的写作层次,每个学生都可以直接进入写作事业的更精细的方面,任何难以模仿的东西都将变得更明显。逗号连接、主谓不一致、冗长的修饰语等令人头痛的机械性问题都不复存在,写作的基础技能已经直接给定了。 正如我所提到的,ChatGPT似乎还只能对它所阐述的主题作比较浅层次的描述,无法太深入。它可以写得足够流畅,并给你一些所需要的细节,但如果你能提供它所缺乏的深入分析和深刻理解,它就还不能替代你的工作。 文本能超越自己吗? 通过在多模态数据集上训练模型,我们可以理解文字、语言中编码的信息如何映射到图像、三维图像和我们周围世界的其他表现形式。“文本到图像”表明,生成的图像可以反映精确的文字描述。但是生成式AI还不能做到尽善尽美,Stable Diffusion模型在其生成的图像中明显存在着赋予人类正确手指数量的问题。 但值得注意的是,在“文本到图像”系统中,仅仅通过扩大语言模型就能实现改进。Imagen使用仅在文本上训练的T5编码器(110亿个参数),产生的图像比DALL-E 2更逼真,后者的文本编码器已被训练为产生类似于匹配图像嵌入的文本嵌入。 也就是说,将文本转化为其他模态的可能性(我们可以做什么,以及我们用目前的方法能走多远)并不明显。对那些看到真正发展限制的观点,我感同身受:尽管“文本到图像”数据集可以告诉我们这个世界的很多景象,但它们不存在于物质世界中,缺乏像我们一样能够与物体、与其他人类互动的能力,并通过互动从周围世界中收集视觉和非视觉信息。 但是显然,有很多事情可以做。谷歌最近的RT-1(变形机器人)展示了如何利用自然语言来解决机器人任务。 “ChatGPT可以为你策划一场主题派对,但它能帮你在派对结束后打扫屋子吗?很可惜不能。我在谷歌机器人的朋友刚刚公布了RT-1,一款带有眼睛、手臂和轮子的变形机器人!” 正如François Chollet在一次采访中向我指出的那样,在“文本到图像”这个领域,神经网络的能力可以大放异彩。我也对潜在的二级应用场景感到兴奋,比如在文本指导下的分子设计和其他并不显而易见的创意。 然而,我认为要真正发掘“文本到X”模型的潜能,着实需要有更好的界面:我们需要以更好的方式,向模型表达我们的意思、概念和想法。提示工程作为一门学科出现,可以反映出我们目前与GPT-3等模型的交流方式是低效的。 展望未来,我认为在我们使“文本到一切”成为现实的过程中,我们需要解决两个驱动发展的问题: 1. 我们如何构建界面,使我们能够更好地将我们的意图传达给AI模型? 2. 这些模型能够为我们带来哪些有用的生成结果或行动? 但是在实际问题之外,我认为另一个问题更有意思:文本到{文本、图像、视频等}的模型并不完美,但非常好用。在将想法以图像或视频的形式呈现出来这一方面,这些模型远比普通人,甚至是本身颇有艺术造诣的人类要好得多。正如Daniel Herman关于ChatGPT提出的问题:对从事艺术、从事视频制作而言,文本到一切意味着什么?我们是否会进入这样一个时期:艺术的基础知识变得更加商品化,任何人都可以通过不同的媒介,以更精细的艺术手法传递自己的思想?在那里,水彩画的技巧被简化为提示中的文字,剩下的就是人类和AI系统之间的共舞互动? 一如既往,我们不应该夸大这些AI系统的能力——它们经常会出现显而易见的错误。但是,当遇到正确的问题时,AI可以表现得很出色,为人类提供更多空间去做更有趣的事情,并追寻写作、艺术的更高层次。 而且,除了这些直接的应用之外,“文本到X”模型及其基础技术还有哪些尚待探索的进一步应用?研究人员已经在考虑如何使用NLP模型来预测蛋白质的氨基酸序列,这是预测字母序列的一个明显的应用,离生成文本只有一步之遥。投资者和人工智能报告的作者Nathan Benaich,在我最近与他的谈话中提到,他对最先进的扩散模型如何应用于生物和化学领域感到兴奋。 今年是“从文本到一切”的一年,如果说从今年的惊人发展中可以学到什么的话,那就是文本作为一种“发出指令”的媒介,正变得更加强大。你不需要艺术培训,也不需要一套数字艺术软件或绘画工具,也能来把“漂浮的城市”这一想法变成视觉现实。你可以把它说出来或打出来,让它存在。 你将用你的文字创造什么? 来源:DeFi之道 作者:Daniel Bashir 来源:金色财经
lg
...
金色财经
2023-02-26
AI绘画对画师有多大的影响
go
lg
...
幅网名为Sincarnate的用户使用
Midjourney
生成的画作,在美国科罗拉多州博览会夺下Fine Arts Exhibition数字艺术首奖。 Ai绘制的肖像画也曾拍过高达300万人民币的天价,2018年,佳士得拍卖行在美国纽约以43.25万美元(约合人民币300万元)的天价拍卖了一幅由AI程序绘制的肖像画。这幅名为《爱德蒙·贝拉米肖像》的作品,以朦胧手法描绘了一名身穿黑色西服外套,搭配白色衬衫的男士。 创作《爱德蒙·贝拉米肖像》是一个叫做Obvious的人工智能,由来自法国巴黎的三名25岁的青年联手设计。团队收集了15000幅肖像画,并将它们输入到一个名为GAN的算法中,然后人工智能学习这些画像的“规则”,并根据这些规则创作出新的图像。 几个Ai制图程序透过各种文本提示工程以生成各种图像。包括OpenAI的DALL-E、 谷歌大脑的Imagen和Parti(2022年5月发布)以及微软的NUWA-Infinity。输入形式还可以包括图像和关键字和/或配置参数,通常通过关键短语输入艺术风格,仅仅通过短短几分钟甚至几十秒Ai就可以输出几张高质量的图片。毫无疑问,Ai图像生成技术很大促进了绘画圈的竞争力,但是同样的Ai绘画似乎也在挤压着初,中阶段画师的生存空间。也在某种意义上磨灭着现实中画手的创作热情 但是在现有技术手段中,Ai没有真正的原创能力,无法做到创新的制作,所以现实中创作的画手们也有着Ai无法替代的方面,虽然未来的画师行业会受到Ai技术的冲击,但是那些不断提升并且有着丰富创造性的画师仍旧不可替代,任何一个人的思维与想法都无法被数字所取代。 来源:金色财经
lg
...
金色财经
2023-02-21
OpenAI与AIGC:改变人类生产范式 通往“万物的摩尔定律”
go
lg
...
(Generative AI) 产品
Midjourney
。 当时艺术正统和机器亵渎引发了争议,其实早在摄影技术兴起时就有过类似的争议,并不妨碍摄影技术革新并,成为了现代艺术的有机组成部分。 因此本文不对此问题做太多探讨,而是旨在对生成式 AI 发展与突破的历史进行复盘,并梳理生成式 AI 会在自然语言、代码、图片、视频、3D 模型等领域带来什么样的下游应用。 回顾历史,人类艺术的发展速度是对数式的,而技术的进步速度是指数式的。生成式 AI 学习了人类艺术对数进化史上的海量画作,实现了创作质量上的指数式进步,并在生产效率上实现了”弯道超车“。模型生成的作品便是今天热议的AIGC (AI Generated Content)。 而本文聚焦的公司 OpenAI ,在这场生成式 AI 的突破中起到了关键性的作用,通过堆叠海量算力的大模型(Foundation Model)使 AIGC 进化。 在 2022 年上半年,OpenAI 旗下三个大模型 GPT-3、GitHub Copilot 和 DALL·E2 的注册人数均突破了 100 万人,其中 GPT-3 花了 2 年,GitHub Copilot 花了半年,而 DALL·E2 只用了2个半月达到了这一里程碑,足见这一领域热度的提升。 研究型企业引领的大模型发展,也给了下游应用领域很大的想象空间,语言生成领域已经在文案生成、新闻撰写、代码生成等领域诞生了多家百万级用户、千万级美金收入的公司。 而最出圈的图片生成领域两大产品
MidJourney
和 Stable Diffusion 都已经有相当大的用户群体,微软也已经布局在设计软件中为视觉设计师提供 AIGC 内容,作为设计灵感和素材的来源。同时 3D 和视频生成领域的大模型也在飞速突破的过程中,未来很可能会在游戏原画、影视特效、文物修复等领域发挥作用。 从神经网络的角度看,当前的大模型 GPT-3 有 1750 亿参数,人类大脑有约 100 万亿神经元,约 100 个神经元会组成一个皮质柱,类似于一个小的黑盒神经网络模块,数量级上的差异决定了算力进步可以发展的空间还很大。与此同时,今天训练 1750 亿参数的 GPT-3 的成本大概在 450 万美元左右,根据成本每年降低约 60% 的水平,供大模型提升计算复杂度的空间还很多。 OpenAI CEO、YC 前主席 Sam Altman 的图景中,AI 大模型发展的最终目标是 AGI(通用人工智能,Artificial General Intelligence),当这一目标实现的时候,人类经济社会将实现”万物的摩尔定律“,即万物的智能成本无限降低,人类的生产力与创造力得到解放。 归纳并演绎生成式 AI 是什么 AI 模型大致可以分为两类:决策式 AI 与生成式 AI。 根据机器学习教科书,决策式模型 (Discriminant Model)学习数据中的条件概率分布;生成式模型 (Generative Model)学习数据中的联合概率分布,两者的区别在于擅长解决问题的方式不同: 决策式 AI 擅长的是基于历史预估当下,有两大类主要的模型应用,一类是辅助决策,常用在推荐系统和风控系统中;第二类是决策智能体,常用于自动驾驶和机器人领域。 生成式 AI 擅长的是归纳后演绎创造,基于历史进行缝合式创作、模仿式创新——成为创作者飞船的大副。所谓 AIGC(AI Generated Content),便是使用生成式AI主导/辅助创作的艺术作品。 不过在10年代的机器学习教科书中,早已就有了这两类AI。为何 AIGC 在20年代初有了显著突破呢?答案是大模型的突破。 The Bitter Lesson大模型助 AIGC 进化 时间倒回到 19 年 3 月,强化学习之父 Richard Sutton 发布了名为 The Bitter Lesson(苦涩的教训)的博客,其中提到:”短期内要使AI能力有所进步,研究者应寻求在模型中利用人类先验知识;但之于AI的发展,唯一的关键点是对算力资源的充分利用。“ Seeking an improvement that makes a difference in the shorter term, researchers seek to leverage their human knowledge of the domain, but the only thing that matters in the long run is the leveraging of computation. 该文章在当时被不少 AI 研究者视为对自己工作的否定,极力辩护。但如果拉长时间线回看,会发现这位泰斗所言不虚: 机器学习模型可以从参数量级上分为两类:统计学习模型,如 SVM(支持向量机)、决策树等数学理论完备,算力运用克制的模型;和深度学习模型,以多层神经网络的深度堆叠为结构,来达到高维度暴力逼近似然解的效果,理论上不优雅但能高效的运用算力进行并行计算。 神经网络模型在上世纪 90 年代出现,但在 2010 年前,统计学习模型仍是主流;后来得益于 GPU 算力的高速进步,基于神经网络的深度学习模型逐渐成为主流。 深度学习充分利用了 GPU 擅长并行计算的能力,基于庞大的数据集、复杂的参数结构一次次实现出惊人的效果,刷新预期。大模型便是深度学习模型参数量达到一定量级,只有大型科技公司才能部署的深度学习模型。 2019年,OpenAI 从非营利组织变为营利性公司,接受微软 10 亿美金注资。这一合作奠定了他们有更多算力资源,并能依仗微软的云基础建设随时将大模型(Foundation Model)发布为商用 api。 与此同时,还有第三件事值得关注,大模型 AI 的研究方向出现了转变,从智能决策式 AI 转变为内容生成式 AI:原本主要大模型集中于游戏的智能决策体,如 DeepMind 开发的打败围棋冠军的 AlphaGo、OpenAI 开发的打败 Dota 职业选手的 OpenAI Five。 Transformer 模型(后文将详细介绍)的发布让 OpenAI 嗅到了更适合他们的机会——预训练语言模型。在那之后,他们开始在 AIGC 的方向上开枝散叶:沿着 2018 年时低调发布的 GPT 模型轨迹发布了一系列模型族,一次次刷新文本生成大模型的效果,印证 Sutton 提出的宗旨:充分运用海量算力让模型自由的进行探索和学习。 OpenAI的大模型发展之路 2019年2月:GPT-2 初版发布,1.2 亿参数量 2019年3月:OpenAI LP 成立 2019年7月:微软注资 10 亿美金 2019年11月:GPT-2 最终版发布,15 亿参数量,宣布暂时不开放使用为避免假信息伪造 2020年6月:GPT-3 发布,1750 亿参数量,后续开放 OpenAI API 作为商用 2021年1月:DALL·E 与 CLIP 发布 2021年10月:OpenAI Codex 发布,为 GPT-3 为 coding 场景的特化模型、Github Copilot 的上游模型 2022年4月:DALL·E2 发布 1、GPT-3,AI文本生成巅峰之作 深度学习兴起于计算机视觉领域的应用,而大模型的发展开始于 NLP 领域。在数据、算力充分发展的过程中,Transformer 模型以 attention 机制高度并行化的结构充分利用算力,成为 NLP 领域预训练模型的标杆。 著名的独角兽 Hugging Face 也是从对该模型的复现和开源起家。除了 attention 机制的高效之外,它还有两个重要特点:迁移学习(transfer learning)和自监督学习(self-supervised learning)。 顾名思义,迁移学习指在一个极庞大的数据集上充分学习历史上的各类文本,把经验迁移到其他文本上。 算法工程师会将第一步训练完成的模型存储下来,称为预训练模型。需要执行具体任务时,基于预训练版本,进行定制化微调(fine-tune)、或展示少许范例(few-shot/zero-shot)。 而自监督学习,得从机器学习中的监督学习讲起。前面提到若需要学习一匹马是否在奔跑,需要有一个完整标注好的大数据集。 自监督学习不需要,当 AI 拿到一个语料库,可以通过遮住一句话中的某个单词、遮住某句话的下一句话的方式,来模拟一个标注数据集,帮模型理解每个词的上下文语境,找到长文本之间的关联。该方案大幅提高了对数据集的使用效率。 谷歌发布的 BERT 是 Transformer 时代的先驱,OpenAI 发布的 GPT-2 以相似的结构、更胜一筹的算力后来居上。直到2020年6月,OpenAI 发布了 GPT-3,成为该模型族,甚至整个文本生成领域的标杆。 GPT-3 的成功在于量变产生质变:参数比 GPT-2 多了两个数量级(1750亿vs 15亿个参数),它用的最大数据集在处理前容量达到 45TB。 如此巨大的模型量级,效果也是史无前例的。给 GPT-3 输入新闻标题”联合卫理公会同意这一历史性分裂“和副标题”反对同性恋婚姻的人将创建自己的教派“,生成了一则以假乱真的新闻,评估人员判断出其为AI生成的准确率仅为 12%。以下是这则新闻的节选: 据《华盛顿邮报》报道,经过两天的激烈辩论,联合卫理公会同意了一次历史性的分裂:要么创立新教派,要么”保持神学和社会意义上的保守“。大部分参加五月教会年度会议的代表投票赞成进一步禁止 LGBTQ 神职人员的任命,并制定新的规则”规范“主持同性婚礼的神职人员。但是反对这些措施的人有一个新计划:于2020 年组成一个新教派”基督教卫理公会“。 要达到上述效果,成本不容小觑:从公开数据看,训练一个 BERT 模型租用云算力要花约 1.2 万美元,训练 GPT-2 每小时要花费 256 美元,但 OpenAI 并未公布总计时间成本。考虑到 GPT-3 需要的算力是 BERT 的 2000 多倍,预估发布当时的训练成本肯定是千万美元级别,以至于研究者在论文第九页说:我们发现了一个 bug,但没钱再去重新训练模型,就先这么算了吧。 2、背后DALL·E 2,从文本到图片 GPT-3杀青后,OpenAI 把大模型的思路迁移到了图片多模态(multimodal)生成领域,从文本到图片主要有两步:多模态匹配:将 AI 对文本的理解迁移至对图片的理解;图片生成:生成出最符合要求的高质量图片。 对于多模态学习模块,OpenAI 在 2021 年推出了 CLIP 模型,该模型以人类的方式浏览图像并总结为文本内容,也可以转置为浏览文本并总结为图像内容(DALL·E 2中的使用方式)。 CLIP (Contrastive Language-Image Pre-Training) 最初的核心思想比较简单:在一个图像-文本对数据集上训练一个比对模型,对来自同一样本对的图像和文本产生高相似性得分,而对不匹配的文本和图像产生低相似性分(用当前图像和训练集中的其他对的文本构成不匹配的样本对)。 对于内容生成模块,前面探讨了文本领域:10 年代末 NLP 领域生成模型的发展,是 GPT-3 暴力出奇迹的温床。而计算机视觉 CV 领域 10 年代最重要的生成模型是 2014 年发布的生成对抗网络(GAN),红极一时的 DeepFake 便是基于这个模型。GAN的全称是 Generative Adversarial Networks——生成对抗网络,显然”对抗“是其核心精神。 注:受博弈论启发,GAN 在训练一个子模型A的同时,训练另一个子模型B来判断它的同僚A生成的是真实图像还是伪造图像,两者在一个极小极大的博弈中不断变强。 当A生成足以”骗“过B的图像时,模型认为它比较好地拟合出了真实图像的数据分布,进而用于生成逼真的图像。当然,GAN方法也存在一个问题,博弈均衡点的不稳定性加上深度学习的黑盒特性使其生成。 不过 OpenAI 大模型生成图片使用的已不是 GAN 了,而是扩散模型。2021年,生成扩散模型(Diffusion Model)在学界开始受到关注,成为图片生成领域新贵。 它在发表之初其实并没有收到太多的关注,主要有两点原因: 其一灵感来自于热力学领域,理解成本稍高; 其二计算成本更高,对于大多高校学术实验室的显卡配置而言,训练时间比 GAN 更长更难接受。 该模型借鉴了热力学中扩散过程的条件概率传递方式,通过主动增加图片中的噪音破坏训练数据,然后模型反复训练找出如何逆转这种噪音过程恢复原始图像,训练完成后。扩散模型就可以应用去噪方法从随机输入中合成新颖的”干净“数据。该方法的生成效果和图片分辨率上都有显著提升。 不过,算力正是大模型研发公司的强项,很快扩散模型就在大公司的调试下成为生成模型新标杆,当前最先进的两个文本生成图像模型——OpenAI 的 DALL·E 2 和 Google 的 Imagen,都基于扩散模型。DALL·E 2 生成的图像分辨率达到了 1024 × 1024 像素。例如下图”生成一幅莫奈风格的日出时坐在田野里的狐狸的图像“: 除了图像生成质量高,DALL·E 2 最引以为傲的是 inpainting 功能:基于文本引导进行图像编辑,在考虑阴影、反射和纹理的同时添加和删除元素,其随机性很适合为画师基于现有画作提供创作的灵感。比如下图中加入一只符合该油画风格的柯基: DALL·E 2 发布才五个月,尚没有 OpenAI 的商业化api开放,但有 Stable Diffusion、
MidJourney
等下游公司进行了复现乃至商业化,将在后文应用部分介绍。 3、OpenAI的使命——开拓通往 AGI 之路 AIGC 大模型取得突破,OpenAI 只开放了api和模型思路供大家借鉴和使用,没去做下游使用场景的商业产品,是为什么呢?因为 OpenAI 的目标从来不是商业产品,而是通用人工智能 AGI。 OpenAI 的创始人 Sam Altman 是 YC 前总裁,投出过 Airbnb、Stripe、Reddit 等明星独角兽(另一位创始人 Elon Musk 在 18 年因为特斯拉与 OpenAI ”利益相关“离开)。 他在 21 年发布过一篇著名的博客《万物的摩尔定律》,其中提到 OpenAI,乃至整个 AI 行业的使命是通过实现 AGI 来降低所有人经济生活中的智能成本。这里所谓 AGI,指的是能完成平均水准人类各类任务的智能体。 因此,OpenAI 始终保持着学术型企业的姿态处于行业上游,成为学界与业界的桥梁。当学界涌现出最新的 state-of-art 模型,他们能抓住机会通过海量算力和数据集的堆叠扩大模型的规模,达到模型意义上的规模经济。 在此之后克制地开放商业化 api,一方面是为了打平能源成本,更主要是通过数据飞轮效应带来的模型进化收益:积累更富裕的数据优化迭代下一代大模型,在通往 AGI 的路上走得更坚实。 定位相似的另一家公司是 Deepmind——2010年成立,2014 年被谷歌收购。同样背靠科技巨头,也同样从强化学习智能决策领域起家,麾下的 AlphaGo 名声在外,Elon Musk 和 Sam Altman 刚开始组局创办 OpenAI,首要的研究领域就是步 AlphaGo 后尘的游戏决策 AI。 不过 19 年后,两者的研究重心出现了分叉。DeepMind 转向使用 AI 解决基础科学如生物、数学等问题:AlphaFold 在预测蛋白质结构上取得了突破性的进展,另一个 AI 模型 AlphaTensor 自己探索出了一个 50 年悬而未决的数学问题:找到两个矩阵相乘的最快方法,两个研究都登上了 Nature 杂志的封面。而 OpenAI 则转向了日常应用的内容生成 AIGC 领域。 AIGC大模型是通往 AGI 路上极为重要、也有些出乎意料的一站。其重要性体现在 AI 对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间的互通成为可能。 例如从自然语言生成编程语言,可以产生新的人机交互方式;从自然语言生成图片和视频,可以革新内容行业的生产范式。意外性则是,最先可能被替代的不是蓝领,而是创作者,DeepMind 甚至在协助科学家一起探索科研的边界。 OpenAI 的模式也给了下游创业者更多空间。可以类比当年预训练语言模型发展初期,Hugging Face把握机会成为大模型下游的模型开源平台,补足了模型规模膨胀下机器学习民主化的市场空间。 而对 AIGC 模型,未来会有一类基于大模型的创业公司,把预训练完成的 AIGC 模型针对每个子领域进行调优。不只需要模型参数优化,更要基于行业落地场景、产品交互方式、后续服务等,帮助某个行业真正用上大模型。 正如 AI 的 bitter lesson 一样矛盾,投资者需要短期投资回报率、研究者需要短期投稿成功率,尽管OpenAI 走在通往 AGI 正确的路上,这条路道阻且长,短期很难看到极大的突破。而 Sam Altman 展望的大模型应用层公司很有可能有更高的高投资回报,让我们来介绍下主要的分类与创业者。 百家争鸣的 AIGC 大模型应用层 对应 OpenAI 大模型发布的顺序,模型应用层相对最成熟的是文本生成领域,其次是图片生成领域,其他领域由于还未出现统治级的大模型相对落后。 文本领域天然应用场景丰富,且 GPT-3 开放 api 很久,细分赛道很多。大致可以根据生成内容不同分为两类:机器编程语言生成、人类自然语言生成。前者主要有代码和软件行为的生成等,后者主要有新闻撰写、文案创作、聊天机器人等。 而图片领域当前还专注于图片自身内容的生成,预期随着未来3D、视频相关内容生成能力的增强,会有更多结合不同业务场景如游戏、影视这样细分领域的创业公司。 以下是海外各子领域创业公司的梳理,接下来将针对几个领域的重要公司进行介绍。 1、编程语言 文本领域最成熟的应用暂时不在人类自然语言,而是在代码等机器语言的生成领域。因为机器语言相对更结构化,易学习;比如鲜有长文本的上下文关系、基于语境的不同含义等情况。 (1)代码生成:Github Copilot 代表公司是微软出品的 Github Copilot,编程中的副驾驶。该产品基于 OpenAI 专门用 GPT-3 为编程场景定制的AI模型 Codex。使用者文字输入代码逻辑,它能快速理解,根据海量开源代码生成造好的轮子供开发者使用。提高一家科技公司 10% 的 coding 效率能带来很大收益,微软内部已进行推广使用。 相比低代码工具,Copilot 的目标群体是代码工作者。未来的低代码可能是两者结合:低代码 UI 界面实现代码框架搭建,代码子模块通过 Copilot 自动生成。 正如 Copilot 的 slogan:Don’t fly solo,没有 Copilot 的帮助 coder 的工作会变得繁冗,没有 coder 的指引 Copilot 生成的内容可能会出现纰漏。也有用户报告了一些侵犯代码版权、或代码泄露的案例,当前技术进步快于版权法规产生了一定的空白。 (2)软件行为生成:Adept.ai Adept.ai 是一家明星创业公司。创始团队中有两人是Transformer 模型论文作者,CEO 是谷歌大脑中大模型的技术负责人,已经获得 Greylock 等公司 6500 万美元的 A 轮融资。 他们的主要产品是大模型 ACT-1,让算法理解人类语言并使机器自动执行任务。目前产品形态是个 chrome 插件,用户输入一句话,能实现单击、输入、滚动屏幕行文。在展示 demo中,一位客服让浏览器中自动记录下与某位顾客的电话,正在考虑买 100 个产品。这个任务需要点击 10 次以上,但通过 ACT-1 一句话就能完成。 软件行为生成颠覆的是当下的人机交互形式,使用文字或语音的自然语言形式来代替当下人与机器的图形交互模式(GUI)。大模型成熟后,人们使用搜索引擎、生产力工具的方式都将变得截然不同。 2、自然语言 自然语言下还有多个应用型文本生成领域值得关注:新闻撰写、文案创作、对话机器人等。 (1)新闻撰写 最著名的是 Automated Inights。他们的结构化数据新闻撰写工具叫做 wordsmith,通过输入相应数据和优先级排序,能产出一篇基于数据的新闻报道。该工具已在为美联社每季度自动化产出 300 余篇财报相关报道,在雅虎体育新闻中也已经崭露头角。据分析师评价,由 AI 完成的新闻初稿已接近人类记者在 30 分钟内完成的报道水准。 Narrative Science是另一家新闻撰写生成公司,其创始人甚至曾预测,到 2030 年,90%以上的新闻将由机器人完成。 (2)文案创作 该领域竞争较为激烈,有copy.ai、Jasper、copysmith 等公司。他们基于 GPT-3 的能力加入了文案领域的人工模板与结构,为商家和个人创作者提供了快速为自己的商品、内容进行宣传的能力。以copysmith 为例: (3)对话机器人 前面提到的 Adept.ai 由Transformer 模型的一作和三作联合创立;而二作也创业了,他创办的 Character.ai 是当前对话机器人中使用效果最逼真的。 该对话机器人可以自定义或使用模板来定义角色的家庭、职业、年龄等,在此基础上保持一贯的设定和符合设定的对话风格。经常能体现出一定的共情对话能力带给人惊喜,并且支持多语言互通。 比如他们有已训练好的马斯克等名人和一些动漫角色,与他们对话会有很棒的代入感。 而商业化的对话机器人,在客服、销售等行业有巨大的市场空间,但如今还为成熟。 主要出现的问题有二: 其一,客服、销售行业遇到的客户往往情绪状态不稳定,AI 难以对情绪进行适应并调整对话内容; 其二,AI 的多轮对话能力较弱,无法保证持续有效的跟进问题。 (4)创作性文本 AI 对于长文本创作有一定困难,难以保持1000字以上的文本创作后仍能进行上下文的联系。 但基于短文本创作仍有一些有趣的应用,例如基于GPT-3的 AI Dungeon,可以引导 AI 创造一个虚拟游戏世界观。该领域进一步的成长需要期待未来 3-5 年,有成熟的能产出千字内容的 AI 出现。 3、多模态图片 DALL·E2 是极具突破性的 AIGC 大模型,但距离丰富生产力和创造力的成熟产品还有差距。因此有研究者顺着 DALL·E 和 CLIP 的思路开发了开源版本的扩散模型,就像当年的 Hugging Face 那样,并将其根据创作者社区的反馈转变为更成熟易用的商业产品。接下来就介绍几个主要出圈的模型: (1)Disco Diffusion 最早出圈的 AI 绘图工具是开源模型Disco Diffusion。发布时间比 DALL·E 2 稍晚,同样也是 CLIP + Diffusion Model 的结构,生成效果让许多插画师担心起了失业。 尽管很多插画师和 AI 工具爱好者的推荐都认可了该工具的易用性和生成效果的出众,但其生成时间略长有待优化,可以认为是大家对图片生成大模型的初体验。 (2)
MidJourney
该模型发布后不久,Disco Diffusion 的开发者 Somnai 加入了
MidJourney
,和团队一起打造了一款产品化的 Disco Diffusion。
Midjourney
的创始人 David Holz 并不是以CV(计算机视觉)研究为主,更关注人机交互。产品公测和主要交流平台都基于Discord,使用 Discord Bot 进行交互,打造了相当良好的社区讨论环境。 使用中印象深刻的有几个重要功能:
MidJourney
画廊中可以看到每时每刻创作者们用 MJ 创作出的作品,用户可以对作品进行打分,每周排名靠前的作品将得到额外的 fast GPU 时间奖励。 同时,MJ官方还为用户贴心的提供了引导语 prompt 集合和 AI 擅长的风格指南,指导用户如何最高效的生成出他们想要的图片。 基于良好的产品和社区体验,
MidJourney
的付费用户量也是目前最大的。 目前收费模式采用了订阅制,个人用户有两个档位,每月最多 200 张图片(超额另收费)的 10 美元/月,以及”不限量“图片的 30 美元/月;对企业客户,单人一年收费仅有 600 美元,且生成的作品可以商用(当前法规尚不完善,仍可能存在一定版权问题)。 (3)Stable Diffusion 如果说
MidJourney
是一个勤勤恳恳的绩优生,那么 Stability.ai 则是天赋异禀技术力强、诞生之初就备受 VC 追捧的富二代,公司估值已达到十亿美元。产品 Stable Diffusion 首要目标是一个开源共创模型,与当年的 Hugging Face 神似。 创始人 Emad 之前是对冲基金经理,用自己充裕的资金联合 LMU 和 Runaway ML开发了开源的 Stable Diffusion,在 Twitter 上使用扎克伯格在 Oculus 发布会上的照片作为背景,号召SD会成为”人类图像知识的基础设施“,通过开源让所有人都能够使用和改进它,并让所有人更好地合作。 Stable Diffusion 可以认为是一个开源版本的DALL·E2,甚至不少使用者认为是当前生成模型可以使用的最佳选择。官方版本部署在官网 Dream Studio 上,开放给所有用户注册。 相比其他模型,有很多可以定制化的点。不过官网只有 200 张免费额度,超过需要付费使用,也可以自行使用开源 Colab 代码版无限次使用。此外,Stable Diffusion 在压缩模型容量,希望使该模型成为唯一能在本地而非云端部署使用的 AIGC 大模型。 05 AIGC大模型的未来展望 1、应用层:多模态内容生成更加智能,深入各行业应用场景 上述的多模态图片生成产品当前主要局限于创作画作的草图和提供灵感。在未来待版权问题完备后, AIGC 内容能进入商用后,必然会更深入地与业界的实际应用进行结合: 以游戏行业为例, AI 作画给了非美术专业工作者,如游戏策划快速通过视觉图像表达自己需求和想法的机会;而对美术画师来说,它能够在前期协助更高效、直接地尝试灵感方案草图,在后期节省画面细节补全等人力。 此外,在影视动画行业、视频特效领域,甚至是文物修复专业,AI 图片生成的能力都有很大想象空间。当然,这个领域 AI 的能力也有着不小的进步空间,在下面的未来展望部分进行阐发。 目前 AIGC 存在 Prompt Engineering 的现象,即输入某一些魔法词后生成效果更好。这是目前大模型对文本理解的一些缺陷,被用户通过反向工程进行优化的结果。未来随着语言模型和多模态匹配的不断优化,不会是常态,但中短期内预期Prompt Engineering 还是得到好的生成内容的必备流程之一。 2、模态层:3D生成、视频生成 AIGC 未来3-5年内有明显进步 多模态(multimodal)指不同信息媒介之间的转换。 当前 AI 作图过程中暴露的问题会成为视频生成模型的阿喀琉斯之踵。 例如:AI 作画的空间感和物理规则往往是缺失的,镜面反射、透视这类视觉规则时常有所扭曲;AI 对同一实体的刻画缺少连续性。根本原因可能是目前深度学习还难以基于样本实现一些客观规则泛化,需要等待模型结构的优化进行更新。 3D生成领域也有很大价值:3D 图纸草图、影视行业模拟运镜、体育赛场现场还原,都是 3D 内容生成的用武之地。这一技术突破也渐渐成为可能。 2020年,神经辐射场(NeRF)模型发布,可以很好的完成三维重建任务:一个场景下的不同视角图像提供给模型作为输入,然后优化 NeRF 以恢复该特定场景的几何形状。 基于该技术,谷歌在2022年发布了 Dream Fusion 模型,能根据一段话生成 360 度三维图片。这一领域当前的实现效果还有优化空间,预期在未来3-5年内会取得突破性进展,推动视频生成的进步。 3、模型层:大模型参数规模将逼近人脑神经元数量 近年的大模型并未对技术框架做颠覆性创新,文本和图像生成领域在大模型出现前,已有较成熟方案。但大模型以量变产生质变。 从神经网络角度看,大脑有约 100 万亿神经元, GPT-3 有 1750 亿参数,还相差了 1000 倍的数量级,随着算力进步可以发展的空间还很大。 神经网络本质是对高维数据进行复杂的非线性组合,从而逼近所观测数据分布的最优解,未来一定会有更强的算力、更精妙的参数堆叠结构,来刷新人们对AI生成能力的认知。 4、成本结构决定大模型市场的马太效应 大模型最直接的成本便是能源成本(energy cost),GPT-3 发布时的训练成本在千万美元级别。难以在短期内衡量 ROI ,大科技公司才能训练大模型。 但随着近年模型压缩、硬件应用的进步,GPT-3 量级的模型成本很可能已降至百万美元量级,Stable Diffusion 作为一个刚发布一个月的产品,已经把原本 7GB 的预训练模型优化压缩至 2GB 左右。 在这样的背景下,算力成本在未来必然会逐渐变得更合理,但 AIGC 领域的另一个成本项让笔者对市场结构的预测还是寡头垄断式的。 大模型有明显的先发优势,来自巨大的隐形成本:智能成本。前期快速积累用户反馈数据能帮助模型持续追新优化,甩开后发的竞争者,达到模型性能的规模效应。 AI 的进化来自于数据的积累和充分吸收。深度学习,乃至当前的所有机器学习都是基于历史预估未来,基于已有的数据给到最接近真实的可能。 正如前文讨论的,OpenAI 的目标从来不是留恋于某个局部行业的商业产品,而是通过模型规模经济,不断地降低人类社会全局的智能成本,逼近通用人工智能 AGI。规模经济正体现在智能成本上。 5、虚拟世界的 AGI 会先于现实世界诞生 从更宏观的视角上,虚拟世界 AI 技术的智能成本比现实世界中来得低得多。现实里 AI 应用最普遍的是无人驾驶、机器人等场景,都对 Corner Case 要求极高。 对于AI模型而言,一件事超过他们的经验范畴(统计上out of distribution),模型将立马化身人工智障,不具备推演能力。现实世界中 corner case 带来的生命威胁、商业资损,造成数据积累过程中极大的试错成本。 虚拟世界则不同,绘图时遇到错位扭曲的图片,大家会在 Discord 中交流一笑了之;游戏 AI 产生奇怪行为,还可能被玩家开发出搞怪玩法、造成病毒传播。 因此虚拟世界,尤其是泛娱乐场景下的 AIGC 积累数据成本低会成为优势。这个领域的 AI 如果节省人力、生成内容产生的商业价值能大于算力成本,能很顺畅地形成低成本的正向循环。 伴随着另一个重要的革新——长期 Web3.0元宇宙场景下新内容经济生态的形成,虚拟世界内容场景下的 AI 很可能更早触及到 AGI。 来源:金色财经
lg
...
金色财经
2023-02-21
人工智慧再掀熱潮、加密貨幣總市值回升
go
lg
...
議題。近期從ChatGPT聊天機器人、
Midjourney
圖像創作、MuseNet音樂創作、到GitHub Copilot輔助編程,可以看到生成式人工智慧為生活帶來具體效益,但也不能忽視相關挑戰,像是著作權難題、強化刻板印象及偏見、成為製造假訊息的利器。 「換言之,法律能管人,但管得了AI嗎?我們要謹慎看待。」蔡玉玲強調。 臺北市政府資訊局局長趙式隆指出,台北市市長蔣萬安的參選政見曾提到,希望勾勒出台北新創產業的新藍圖,尤其是向矽谷經驗學習,希望打造台北成為全世界最大的新創場域。目前透過台北智慧城市專案辦公室(TPMO),幫助企業針對創新題目找到地方做實證,能提供跨局處的溝通,協助找到在地場域創新題目,並因應法規排除相關困難,運用公部門資源,打造台北市成為最大也最友善的living lab實驗室! 數位經濟暨產業發展協會副理事長、台灣區塊鏈愛好者協會榮譽理事長、國家通訊傳播委員會前主任委員詹婷怡表示,觀察元宇宙到來的時機點,現在就是進行式,且逐步發生當中!因為元宇宙有前提條件,包含基礎建設仰賴網路通訊寬頻、硬體晶片以及平台的架構;另外也需要人機介面、內容、實際服務應用,可以想見,最極端的元宇宙還會有區塊鏈及虛擬貨幣的建構。 在今日的第六屆《Hit AI & Blockchain》人工智慧暨區塊鏈產業高峰會中,也進行「第五屆區塊鏈價值權威榜」頒獎典禮。得獎名單如下:MaiCoin集團獲得最佳虛擬貨幣暨NFT服務集團、ACE王牌數位貨幣交易所獲得最受信賴中心化交易所、CYBAVO共同創辦人暨執行長范紀鍠獲得年度風雲人物、環球睿視AIspeakin語音轉寫服務獲得最佳AI語意語音解決方案。 新聞聯絡人: KNOWING新聞/幣特財經/鍶科技 總編輯楊方儒 0936-135336 jet@knowing.asia 来源:金色财经
lg
...
金色财经
2023-02-15
大家都在购买 AI 代币 但你应该吗?
go
lg
...
交媒体头像的用户。Starry AI、
Midjourney
、BigSleep 和 Pixray 只是其中一些流行起来的。 但随着ChatGPT的推出,人们对人工智能的兴趣在 2022 年 11 月爆发。语言生成模型使用“深度学习”技术根据提示生成文本。这可能包括编写剧本或小说、组织文案,或根据下周你想吃的饭菜清单写购物清单。根据 Google Trends,自推出以来,人们对ChatGPT的兴趣只增不减。 人工智能用例几乎是无限的。几十年来,医生和医疗保健专业人士一直对人工智能通过分析医疗数据以检测模式来改善患者诊断和治疗的潜力大加赞赏。在金融领域,人工智能可用于比普通投资者更快地预测和执行有利可图的交易。(虽然也许越少说越好?) 在 2022 年 AI 技术疯狂涌现之前,我们已经看到 AI 渗透到我们的许多生活中。最引人注目的是 Alexa 和 Siri 等智能扬声器中的自然语言处理器形式。 为什么 AI 代币大涨? 去年 AI 的突然增加导致对 AI 代币的兴趣相应增加。技术对话已经完全被它淹没了:它将如何接管像谷歌这样的搜索引擎,机器学习将如何帮助我们拯救地球免受气候变化的影响,以及它将如何让每个人的工作都过时。 作为科技行业稍微被排斥的弟弟,人工智能总是不可避免地也会为加密对话做出贡献。知名交易员还指出人工智能是下一个牛市的源头。来自Cryptoslate的数据显示,AI 代币市场在过去 7 天内上涨了 86% 以上。 区块链和人工智能在一些人工智能代币中以创新的方式混合在一起。据称,借助 SingularityAI (AGIX),人工智能、区块链、去中心化和隐私以一种新颖的形式结合在一起。该项目的通用人工智能 (AGI) 声称独立于任何中央实体(如 OpenAI 或 Microsoft)。大多数加密货币爱好者都听得入耳。 然而,伴随突然的大市场上涨而来的是更大波动的风险。在撰写本文时,AGIX 在过去 24 小时内下跌了约 18%。 大数据协议 (BDP) 是一种在 2021 年流行的代币,之后徘徊在 2 美分左右,在 1 月份上涨了近 4000%。 然而,批评者质疑人工智能与区块链的兼容性。推特上的一位交易员表示:“当炒作平息时,投机者会离开,因此价格会暴跌,如果你赚钱了,就获利了结。” 一个警世故事 最近人工智能代币市场的飙升应该让人们停下来思考一下。并非每个代币都会持久或基于可持续的商业模式或可展示的技术。 在 AI 热潮之前,有 AI Doctor(AIDOC),这是一个提供基于 AI 的实时健康监测、疾病诊断和个性化治疗建议的平台。根据 2018 年的一篇文章,它是由来自百度和微软的资深科学家以及一些顶尖大学教授组成的中国团队创立的。(这些科学家和教授是谁是个谜。) 听起来很有趣,对吧?嗯,在撰写本文时,该项目似乎已不存在。就互联网而言,它几乎已经消失了。 它的最后一篇报道是在 2018 年,当时Cryptoslate写道,它“正在努力建立一个自动化的医疗价值链,该价值链将根据患者的实时生命体征创建数字数据块……AIDOC 然后使用诊断模块来帮助查明问题的原因,然后列出可能的追索途径。” AIDOC 最后一次在交易所上市是在 2022 年 9 月,之后火币将其退市。 现在,加密货币生态系统比 2018 年成熟得多。假项目更容易被发现,投资者被坑了够多次,社区也吸取了教训。但 AIDOC 的故事仍然是一个警示故事。现在每个人都对 AI 感兴趣,随后的暴涨正在发生,但市场不会总是这么好。 来源:金色财经
lg
...
金色财经
2023-02-09
2023 年的 12 个加密货币预测 DAPP系统开发
go
lg
...
发这项技术。然而,随着ChatGPT和
Midjourney
的发布,AI 技术变得更加突出。 富有创造力的人面前摆着可以说是有史以来最伟大的艺术创作工具之一。知道如何利用 AI 的创作者将脱颖而出。 在Decentralized Arts时事通讯中,我们已经介绍了Botto和Refik Anadol:两个集成人工智能的 NFT 项目。我们写过这样的想法,即所有艺术都是对人类创作艺术的挪用,而人工智能艺术对此更加透明,并作为创意工具的下一个演变。 几年后,您只需编写概要就可以从头开始制作电影。 以太坊仍然是国王,Polygon 是王子 多年来,人们一直在讨论梅西是否是历史上最好的足球运动员。在他带领阿根廷队夺得世界杯冠军之后,似乎已经没有人质疑了。 随着The Merge的成功以及Polygon和其他Layer 2的大量采用,似乎很少有人再讨论谁是区块链之王。 来源:金色财经
lg
...
金色财经
2023-02-09
每个人都在购买 AI 代币 还有机会吗?
go
lg
...
交媒体头像的用户。Starry AI、
Midjourney
、BigSleep 和 Pixray 只是其中一些流行起来的。 但随着ChatGPT的推出,人们对人工智能的兴趣在 2022 年 11 月爆发。语言生成模型使用“深度学习”技术根据提示生成文本。这可能包括编写剧本或小说、组织文案,或根据下周你想吃的饭菜清单写购物清单。根据 Google Trends,自推出以来,人们对ChatGPT的兴趣只增不减。 人工智能用例几乎是无限的。几十年来,医生和医疗保健专业人士一直对人工智能通过分析医疗数据以检测模式来改善患者诊断和治疗的潜力大加赞赏。在金融领域,人工智能可用于比普通投资者更快地预测和执行有利可图的交易。(虽然也许越少说越好?) 在 2022 年 AI 技术疯狂涌现之前,我们已经看到 AI 渗透到我们的许多生活中。最引人注目的是 Alexa 和 Siri 等智能扬声器中的自然语言处理器形式。 为什么 AI 代币大涨? 去年 AI 的突然增加导致对 AI 代币的兴趣相应增加。技术对话已经完全被它淹没了:它将如何接管像谷歌这样的搜索引擎,机器学习将如何帮助我们拯救地球免受气候变化的影响,以及它将如何让每个人的工作都过时。 作为科技行业稍微被排斥的弟弟,人工智能总是不可避免地也会为加密对话做出贡献。知名交易员还指出人工智能是下一个牛市的源头。来自Cryptoslate的数据显示,AI 代币市场在过去 7 天内上涨了 86% 以上。 区块链和人工智能在一些人工智能代币中以创新的方式混合在一起。据称,借助 SingularityAI (AGIX),人工智能、区块链、去中心化和隐私以一种新颖的形式结合在一起。该项目的通用人工智能 (AGI) 声称独立于任何中央实体(如 OpenAI 或 Microsoft)。大多数加密货币爱好者都听得入耳。 然而,伴随突然的大市场上涨而来的是更大波动的风险。在撰写本文时,AGIX 在过去 24 小时内下跌了约 18%。 大数据协议 (BDP) 是一种在 2021 年流行的代币,之后徘徊在 2 美分左右,在 1 月份上涨了近 4000%。 然而,批评者质疑人工智能与区块链的兼容性。推特上的一位交易员表示:“当炒作平息时,投机者会离开,因此价格会暴跌,如果你赚钱了,就获利了结。” 一个警世故事 最近人工智能代币市场的飙升应该让人们停下来思考一下。并非每个代币都会持久或基于可持续的商业模式或可展示的技术。 在 AI 热潮之前,有 AI Doctor(AIDOC),这是一个提供基于 AI 的实时健康监测、疾病诊断和个性化治疗建议的平台。根据 2018 年的一篇文章,它是由来自百度和微软的资深科学家以及一些顶尖大学教授组成的中国团队创立的。(这些科学家和教授是谁是个谜。) 听起来很有趣,对吧?嗯,在撰写本文时,该项目似乎已不存在。就互联网而言,它几乎已经消失了。 它的最后一篇报道是在 2018 年,当时Cryptoslate写道,它“正在努力建立一个自动化的医疗价值链,该价值链将根据患者的实时生命体征创建数字数据块……AIDOC 然后使用诊断模块来帮助查明问题的原因,然后列出可能的追索途径。” AIDOC 最后一次在交易所上市是在 2022 年 9 月,之后火币将其退市。 现在,加密货币生态系统比 2018 年成熟得多。假项目更容易被发现,投资者被坑了够多次,社区也吸取了教训。但 AIDOC 的故事仍然是一个警示故事。现在每个人都对 AI 感兴趣,随后的暴涨正在发生,但市场不会总是这么好。 不要被流行语所迷惑,做你自己的研究。 来源:金色财经
lg
...
金色财经
2023-02-09
上一页
1
•••
17
18
19
20
21
下一页
24小时热点
周评:太疯狂!以色列空袭伊朗引爆中东,中美伦敦谈判细节匮乏 美元遭沉重一击
lg
...
下周展望:中美、中东传巨响!央行超级周来袭,风暴绝不止美联储
lg
...
金市展望:炮声一响黄金万两!中东动荡刺激金价创史上最高周收盘,美联储风暴来袭
lg
...
AI重创焦虑的中国就业市场:数百万个岗位恐被裁掉
lg
...
疯狂暴涨60%——中国生物科技行业迎“DeepSeek时刻” 发生了什么?
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#链上风云#
lg
...
109讨论
#VIP会员尊享#
lg
...
1989讨论
#CES 2025国际消费电子展#
lg
...
21讨论