全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
AMD发布“性能最高的”AI芯片 行业迅速“内卷起来”
go
U)。该公司表示,它们可用于训练和运行
大型
语言
模型
,两款新产品都比前代产品拥有更好的内存容量和更高的能效。 此次发布是AMD五年来最重要的事件之一,说明其将在炙手可热的人工智能加速器市场与英伟达(NVDA.O)展开对决。 首席执行官苏姿丰(Lisa Su)称,MI300X“是世界上性能最高的加速器”,拥有超过1500亿个晶体管,内存是英伟达H100芯片的2.4倍。该芯片据称在训练
大型
语言
模型
方面与英伟达的H100芯片相当,但在推理方面表现更好,而且与Meta Platforms(META.O)的Llama 2(一个700亿参数的
大型
语言
模型
)一起使用时,比H100还要好1.4倍。 MI300A则提供更高性能的计算、更快的模型训练以及30倍的能效提升。其内存容量是H100的1.6倍,还具有统一内存,因此无需再从不同设备移动数据。MI300A将为慧与科技公司在劳伦斯利弗莫尔国家实验室建造的El Capitan超级计算机提供动力。El Capitan被认为是最强大的超级计算机之一,预计提供超过2 exaflops的性能。据称,MI300A APU“现已投入生产,并将被内置到数据中心中。” AMD还宣布了其Ryzen处理器的最新成员Ryzen 8040,可以将更多原生AI功能引入移动设备。该公司表示,8040系列的AI处理性能是之前型号的1.6倍,并集成了神经处理单元(NPU)。Ryzen 8040将不仅限于人工智能用途,与英特尔芯片等竞争产品相比,视频编辑速度将提高65%,游戏速度将提高77%。 AMD预计宏碁、华硕、戴尔、惠普、联想和Razer等制造商将在2024年第一季度发布集成Ryzen 8040芯片的产品。AMD还宣布Ryzen AI软件平台现已广泛使用。 苏姿丰称,预计新产品将使其潜在市场总额增长至450亿美元。AMD已经与微软(MSFT.O)合作,将MI300X放入其Azure虚拟机中。微软首席技术官Kevin Scott还宣布,Azure ND MI300X虚拟机(于11月首次发布)现已推出预览版。Meta则宣布将在其数据中心部署MI300处理器。甲骨文(ORCL.N)也称将在云服务中使用AMD的新款芯片。 苏姿丰还对AI芯片行业的规模做出了令人瞠目结舌的预测,称未来四年内该行业规模可能攀升至超过4000亿美元,比AMD在8月份给出的预测高出两倍多,表明对人工智能硬件的期望正在快速变化。
金融界
2023-12-07
谷歌震撼上新引爆AI,金融科技ETF(159851)逆市飙涨2%,大金融终迎暖意,这一方向获大手笔抢筹
go
歌公司宣布推出其规模最大、功能最强的新
大型
语言
模型
Gemini。据谷歌介绍,Gemini在多项基准测试中跑赢GPT-4。 此举再次引发市场对人工智能产业的持续关注,本轮生成式AI引发的科技产业变革浪潮有望再起波澜!金融科技ETF(159851)、大数据产业ETF(516700)场内价格应声飙涨近2%,信创ETF基金(562030)逆市收涨逾1%。 金融板块也迎来修复,券商、银行悉数收红,券商ETF(512000)、银行ETF(512800)场内价格分别收涨0.56%、0.19%。 图片来源:Wind,截至2023年12月7日 近期券商走势平淡,作为行情风向标,短期内板块上行或更依赖市场整体回暖和相关利好政策的带动。不过券商板块估值已具备较强吸引力,随着活跃资本市场的举措持续出台,机构提示当前投资券商板块或具备较高收益风险比。 重磅数据方面,今日市场迎来11月进出口数据。今年前11月我国进出口总值37.96万亿元人民币,与去年同期持平。11月当月进出口同比增长1.2%,保持了10月起单月增速正增长的态势。外贸进出口累计增速总体保持平稳,月度进出口向好态势进一步巩固。 近日沪指再度来到3000点下方,并逼近前期2923低点位置,短期看,市场仍处于弱势整理中动能不足,市场情绪面及信心修复或仍需要时间。市场在筑底的同时,也在继续力量,酝酿未来行情。建议投资者在控制仓位的前提下,保持耐心,寻找机会。 【ETF全知道热点盘点】下面重点聊聊金融科技、券商两个板块主题的交易和基本面情况。 一、【龙头6连板!双重利好催化,金融科技ETF(159851)放量大涨1.99%,机构:行业价值或将重塑】 受AIGC和数据要素提振,金融科技板块今日全天走强。截至收盘,拓尔思涨近11%,信雅达晋级6连板,新国都上涨超8%,恒银科技涨近6%,中科江南、新致软件、银之杰、指南针等纷纷收涨逾4%。中证金融科技主题指数收涨超2%。 图片来源:Wind,截至2023年12月7日 热门ETF方面,金融科技ETF(159851)午后继续走高,场内价格逆市收涨1.99%,斩获二连阳。全天成交额为2820万元,较上一交易日放量超85%! 图片来源:雪球,截至2023年12月7日 今日金融科技板块走强主要受益于两方面因素提振:①AI方面,谷歌宣布推出其认为规模最大、功能最强大的人工智能模型Gemini,AI产业链成为今日盘面热点。②数据要素方面,国内首个针对数据资产确认制定的省级地方性标准12月5日起实施,数据要素板块近期大受催化。 东吴证券指出2024年,金融科技一方面受益于数据要素,行业将打开想象空间,另一方面受AI赋能影响,或将重塑行业价值,关注板块龙头标的。金融科技布局机会主要体现为以下4点: 1、金融科技政策暖风渐近,跨越式新发展阶段来临。2019年以来,人民银行、银保监会、科技部等监管主体在金融科技标准制定、数据治理与应用、科技与金融场景深度融合等方向颁布了一系列政策,金融科技正在成为驱动金融业变革的重要引擎。 2、数字经济建设进程加速,金融信创迎来机遇。数字经济蓬勃发展,在国民经济中的“稳定器”和“加速器”特征日益凸显;信息安全政策发力,国产化替代进程加速,金融信创直接受益;银行/券商信息技术投入持续提升,其快速增长的IT投资需求为科技金融公司提供广阔发展空间。 3、金融数据要素:政策部署节奏加快,应用前景广阔。数据作用于金融机构,可以优化资源配置,促进行业生产变革,提升金融行业发展的效率与质量;且服务型金融数商也将受益于行业发展。 4、金融垂类模型:深度赋能金融数智化升级,产业生态趋于成熟。金融机构智能化转型需求凸显,接入大模型的意愿相对强烈。当前阶段,海外金融领域专用模型纷纷面世,为行业垂类模型应用提供新范式;国内垂类模型初露峥嵘,龙头标的有望脱颖而出。 资料显示,金融科技ETF(159851)被动跟踪中证金融科技主题指数,第一大权重行业为计算机,占比约80%,覆盖了数字经济、ChatGPT、信创、金融IT等热门主题。其第二大权重行业为非银金融,占比近14%,成份股主要为互联网券商。附前十大权重股一览: 图片来源:中证指数官网 二、【逆市收红!券商ETF(512000)9日狂揽6.5亿元,机构:看好后市阶段转强时旗手超额表现】 今日券商股集体回暖,华创云信、华鑫股份、方正证券涨逾3%,东兴证券涨超2%,红塔证券、申万宏源、中泰证券、东方证券等跟涨逾1%。板块代表ETF——券商ETF(512000)场内价格收涨0.56%,全天成交额4.74亿元。 图片来源:雪球,截至2023年12月7日 近日券商板块行情平淡,资金逢低持续大手笔吸筹。上交所数据显示,券商ETF(512000)近9日获资金连续增仓,合计净流入达6.57亿元;杠杆资金方面,券商ETF(512000)最新单日获融资净买入1.05亿元,最新融资余额18.38亿元,接近年内高点。资金一致看多,显示对券商板块后市表现信心颇足。 图片来源:Wind,截至2023年12月7日 消息面上,有关部门就《全国社会保障基金境内投资管理办法(征求意见稿)》向社会公开征求意见。其中明确将经批准的股票指数投资、交易型开放式指数基金纳入社保基金直接投资范围,股票类、股权类资产最大投资比例分别可达40%和30%,意味着会为A股注入7400亿元资金,有利于持续支持资本市场发展。 政策面上,从下半年开始,“活跃资本市场”利好政策已迈入新阶段,改革的重心由融资端转为投资端。根据机构解读,后续改革方向或体现在两个方面:一是各权益类指数能够在风险可控的前提下实现稳步上涨,二是市场成交活跃度能够保持在较高水平。因此,投资端改革将全面利好券商包括经纪、两融、自营、私募基金、另类投资等各项业务,在政策的持续加码下,券商行业有望开启新一轮上升周期。 中原证券表示,从当前监管层针对投资端改革的政策力度看,2024年券商行业外部经营环境逐渐好转的确定性较强,行业整体经营业绩有望实现进一步改善,增幅则有望超越2023年的水平。 2024年券商板块有望持续对整体估值进行修复,在投资端改革持续推进的过程中,券商板块有望反复活跃,并有望成为市场阶段性转强时的中军领涨板块,建议积极保持对券商板块的持续关注。 国泰君安研报指出,预计资本市场改革举措将更为系统、务实,并进入政策的持续、密集出台期,资本市场运行更为平稳健康、券商行业格局加速重构。 截至最新,券商ETF(512000)标的指数中证全指证券公司最新市净率PB为1.31倍,位于近10年来约11%分位点的底部位置,板块当前具有较高的安全边际及性价比。 图片来源:Wind,截至2023年12月7日 公开资料显示,券商ETF(512000)跟踪中证全指证券公司指数,一键囊括50只上市券商股,其中近6成仓位集中于十大龙头券商,“大资管”+“大投行”龙头齐聚;另外4成仓位兼顾中小券商的业绩高弹性,吸收了中小券商阶段性高爆发特点,是集中布局头部券商、同时兼顾中小券商的高效率投资工具。 数据来源:沪深交易所、华宝基金、Wind。 风险提示:金融科技ETF被动跟踪中证金融科技主题指数,该指数基日为2014.6.30,发布日期为2017.6.22;券商ETF被动跟踪中证全指证券公司指数,该指数基日为2007.6.29,发布于2013.7.15。指数成份股构成根据该指数编制规则适时调整,其回测历史业绩不预示指数未来表现。文中提及个股仅为指数成份股客观展示列举,不作为任何个股推荐,不代表基金管理人和本基金投资方向。任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资人应当认真阅读《基金合同》、《招募说明书》、《基金产品资料概要》等基金法律文件,了解基金的风险收益特征,选择与自身风险承受能力相适应的产品。基金过往业绩并不预示其未来表现!根据基金管理人的评估,金融科技ETF、券商ETF风险等级均为R3-中风险。销售机构(包括基金管理人直销机构和其他销售机构)根据相关法律法规对本基金进行风险评价,投资者应及时关注基金管理人出具的适当性意见,各销售机构关于适当性的意见不必然一致,且基金销售机构所出具的基金产品风险等级评价结果不得低于基金管理人作出的风险等级评价结果。基金合同中关于基金风险收益特征与基金风险等级因考虑因素不同而存在差异。投资者应了解基金的风险收益情况,结合自身投资目的、期限、投资经验及风险承受能力谨慎选择基金产品并自行承担风险。中国证监会对本基金的注册,并不表明其对本基金的投资价值、市场前景和收益做出实质性判断或保证。基金投资需谨慎。 本条资讯来源界面有连云,内容与数据仅供参考,不构成投资建议。AI技术战略提供为有连云。
有连云
2023-12-07
马斯克祝贺谷歌推出Gemini:令人印象深刻
go
谷歌当地时间周三发布了其
大型
语言
模型
Gemini,据称是第一个在MMLU(大规模多任务语言理解)上超越人类专家的模型。特斯拉CEO马斯克刚刚在谷歌CEO皮查伊介绍Gemini的帖子下评论称:“令人印象深刻。”马斯克还回应了谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)的一条帖子,向他表示祝贺。
金融界
2023-12-07
超越GPT-4?谷歌震撼发布最先进AI大模型Gemini,AI人工智能ETF(512930.SH)逆市上涨近1%
go
公司宣布推出其规模最大、功能最强大的新
大型
语言
模型
Gemini,其最强大的TPU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,在性能上是第一个在MMLU上超越人类专家的模型。根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了「最先进的性能」,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。 中信证券表示,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。多模态Gemini模型的正式发布,一方面可以拓宽应用场景的拓展,另一方面能够带来算力需求的持续升级。持续看好后续AI产业的前景,后续GPT-5等模型的发布亦将带来更多的催化。 值得注意的是,该基金跟踪的中证人工智能主题指数估值处于历史低位,最新市净率PB为4.28倍,低于指数近1年80.74%以上的时间,估值性价比突出。 AI人工智能ETF紧密跟踪中证人工智能主题指数,中证人工智能主题指数从沪深市场中选取50只业务涉及为人工智能提供基础资源、技术以及应用支持的上市公司证券作为指数样本,以反映人工智能主题上市公司证券的整体表现。 数据显示,截至2023年11月30日,中证人工智能主题指数(930713)前十大权重股分别为海康威视(002415)、韦尔股份(603501)、科大讯飞(002230)、中际旭创(300308)、金山办公(688111)、澜起科技(688008)、紫光股份(000938)、中科曙光(603019)、浪潮信息(000977)、德赛西威(002920),前十大权重股合计占比49.35%。 本条资讯来源界面有连云,内容与数据仅供参考,不构成投资建议。AI技术战略提供为有连云。
有连云
2023-12-07
谷歌推出其最大、“最有能力”的人工智能模型Gemini
go
该公司正面临越来越大的压力。 谷歌称,
大型
语言
模型
Gemini将包括一套三种不同规格的套件:最大、功能最强大的工具Gemini Ultra;可扩展各种任务的Gemini Pro,以及用于特定任务和移动设备的Gemini Nano。
金融界
2023-12-06
AMD涨1.77% 消息称预计MI300明年出货约达30万~40万颗
go
持高达192GB的HBM3存储器,提供
大型
语言
模型
推导与生成式AI工作负载所需的运算力与存储器效率。
金融界
2023-12-06
加密AI智能体已进化到哪步 会成为链上一等公民吗
go
止,加密领域的机器人还相当初级,但由于
大型
语言
模型
(LLM)的兴起,加密领域之外的机器人已经开始发展成为强大的AI智能体,其最终目标是自主处理复杂的任务并让自己的决策更明智。 在加密领域上构建这些AI智能体产生了几个重要的增强功能: 原生支付:AI智能体可以存在于加密货币之外,但如果我们希望AI智能体执行复杂的操作,他们将需要获得资本。与让AI智能体访问银行账户或支付处理器(例如 Stripe)或处理链下世界中存在的绝大多数其他低效率问题相比,加密领域为AI智能体提供了有意义的改进。 AI智能体钱包所有权:连接到钱包的 AI智能体将有能力拥有资产(例如NFT、收益等),从而赋予智能体所有加密资产固有的数字产权。这对于智能体之间的交易尤其重要。 可验证的、确定性的行为:当行为可证明时(它们可以确保某些行动已完成),AI智能体将最有效。链上交易本质上是确定性的——它们要么发生,要么没有发生——这意味着AI智能体将能够比链下更准确地完成链上任务。 当然,链上AI智能体也有局限性。 一个限制是人AI智能体需要在链下执行逻辑才能提高性能。这意味着链上AI智能体将在链下托管其逻辑/计算以优化效率,但智能体决策将在链上执行,从而允许可验证的操作。重要的是,AAI智能体还可以使用Modulus等 zkML 提供商来确保其链下数据输入得到验证。 AI智能体的另一个主要限制是它们的有用性取决于向它们提供的工具。例如,如果你要求智能体提供实时新闻事件的摘要,则智能体的工具包中需要有一个网络爬虫来梳理互联网以执行给定的任务。你是否需要智能体将回应保存为 PDF 格式?将文件系统添加到工具包里。想要智能体跟单你最喜欢的加密推特KOL吗?智能体需要访问钱包并获得该钱包的密钥签名权限。 纵观当前从确定性到非确定性的情况,大多数加密AI智能体都执行确定性任务。也就是说,人类对任务的参数以及如何完成任务(例如代币交换)进行编程。 加密AI智能体已经从早期的keeper机器人(仍在 DeFi 和预言机应用程序中使用)发展到今天利用 LLM 的更复杂的智能体,包括像Botto这样的自主艺术家;AI智能体可以使用Syndicate 的交易云为自己提供银行服务;以及Autonolas等早期AI智能体服务市场。 已经有各种令人兴奋的前沿应用: 支持AI智能体的“智能钱包” :Dawn利用DawnAI提供AI智能体,可以帮助用户发送交易、执行交易和其他实时链上洞察(例如NFT趋势)。 加密游戏智能体:Parallel Alpha 的最新游戏Colony旨在创建可以拥有钱包并相互交易的 AI 角色。 AI智能体的增强工具包:AI智能体的好坏取决于它们的工具包,与区块链的交互目前是一个新兴领域。加密AI智能体需要钱包、为其提供资金的方式、许可功能、集成人工智能模型以及与其他智能体交互的能力。更具体地说,Gnosis 展示了这个早期基础设施的AI 机制,它用智能合约包装 AI 脚本,这样任何人(包括另一个机器人)都可以调用智能合约来执行代理操作(例如,在预测市场),同时还能够支付智能体费用。 AI增强交易者:为交易者和投机者提供高级操作的DeFi超级应用程序,包括: 如果满足条件,则以美元平均成本(Dollar Cost Averaging)建仓;当Gas价格跌破特定水平时执行交易;监控新的 meme 代币合约;并确定订单路由,而用户无需知道在哪个dapp交易等。 AI智能体长尾市场:虽然像ChatGPT这样的大型应用程序适合某些一般聊天目的,但AI智能体需要针对众多行业、主题和生态位市场进行微调。像Bittensor这样的市场激励“矿工”围绕目标行业(例如加密货币、生物技术、学术界)为特定任务(例如图像生成、预训练、预测建模)训练模型。虽然 Bittensor 还处于萌芽阶段,但开发人员已经在使用它在开源 LLM 的长尾之上构建应用程序/代理。 NPC消费者应用程序智能体:不可玩角色在 MMORPG 等游戏中很常见,但在多人消费者应用程序中不太常见。然而,加密消费者应用程序的金融化性质使AI智能体成为引入新型游戏机制的优秀参与者。开放人工智能基础设施公司 Ritual 最近发布了Frenrug,这是一个基于 LLM 的智能体,在Friend.tech内部运行,将根据用户消息执行交易(购买或出售key)。Friend.tech 用户可以尝试说服智能体购买他们的key、出售其他人的key,或者尝试让 Frenrug 智能体以其他创造性的方式使用其资金。 随着越来越多的应用程序和协议利用AI智能体,人类将使用它们作为访问加密经济的渠道。虽然AI智能体今天看起来像玩具,但在未来,它们将增强日常消费者体验,成为协议的关键利益相关者,并在它们之间创建整个经济体。 AI智能体还处于起步阶段,但这些链上经济体的一等公民已经开始展示其潜力。 来源:金色财经
金色财经
2023-12-06
报道:预计超微MI300明年出货约达30万~40万颗
go
持高达192GB的HBM3存储器,提供
大型
语言
模型
推导与生成式AI工作负载所需的运算力与存储器效率。
金融界
2023-12-06
Footprint Analytics x Future3 Campus联合发布AI与Web3研究报告
go
图 7:区块链数据与 LLM 的融合
大型
语言
模型
的培训需要依赖大规模数据,通过学习数据中的模式来建立模型。区块链数据中蕴含的交互和行为模式是 LLM 学习的燃料。数据量和质量也直接影响 LLM 模型的学习效果。 数据不仅仅是 LLM 的消耗品,LLM 还有助于生产数据,甚至可以提供反馈。例如,LLM 可以协助数据分析师在数据预处理方面做出贡献,如数据清洗和标注,或者生成结构化数据,清除数据中的噪声,凸显有效信息。 3.3 增强 LLM 的常用技术解决方案 ChatGPT 的出现,不仅向我们展示了 LLM 解决复杂问题的通用能力,同时也引发了全球范围的,对在通用能力上去叠加外部能力的探索。这里包括,通用能力的增强(包括上下文长度、复杂推理、数学、代码、多模态等)以及外部能力的扩充(处理非结构化数据、使用更复杂的工具、与物理世界的交互等)。如何将 crypto 领域的专有知识以及个人的个性化私有数据嫁接到大模型的通用能力上,是大模型在 crypto 垂直领域商业化落地的核心技术问题。 目前,大多数应用都集中在检索增强生成(RAG)上,比如提示工程和嵌入技术,已经存在的代理工具也大多都聚焦于提高 RAG 工作的效率和准确性。市场上主要的基于 LLM 技术的应用栈的参考架构有以下几种: Prompt Engineering 图 8:Prompt Engineering 当前,大多数从业者在构建应用时采用基础解决方案,即 Prompt Engineering。这一方法通过设计特定的 Prompt 来改变模型的输入,以满足特定应用的需求,是最方便快捷的做法。然而,基础的 Prompt Engineering 存在一些限制,如数据库更新不及时、内容冗杂、以及对输入上下文长度(In-Context Length)的支持和多轮问答的限制。 因此,行业内也在研究更先进的改进方案,包括嵌入(Embedding)和微调(Fine-tuning)。 嵌入(Embedding) 嵌入(Embedding)是一种广泛应用于人工智能领域的数据表示方法,能高效捕获对象的语义信息。通过将对象属性映射成向量形式,嵌入技术能够通过分析向量之间的相互关系,快速找到最有可能正确的答案。嵌入可以在 LLM 的基础上构建,以利用该模型在广泛语料上学到的丰富语言知识。通过嵌入技术将特定任务或领域的信息引入到预训练的大模型中,使得模型更专业化,更适应特定任务,同时保留了基础模型的通用性。 用通俗的话来讲,嵌入就类似于你给一个经过综合训练的大学生一本工具书,让他拿着拥有特定任务相关知识的工具书去完成任务,他可以随时查阅工具书,然后可以解决特定的问题。 微调(Fine-tuning) 图 9:Fine Tuning 微调(Fine-tuning)与嵌入不同,通过更新已经预训练的语言模型的参数,使其适应特定任务。这种方法允许模型在特定任务上表现出更好的性能,同时保持通用性。微调的核心思想是调整模型参数,捕捉与目标任务相关的特定模式和关系。但微调的模型通用能力上限仍然受限于基座模型本身。 用通俗的话来讲,微调就类似于给经过综合训练的大学生上专业知识课程,让他掌握除了综合能力以外的专业课知识,能自行解决专业板块的问题。 重新训练 LLM 当前的 LLM 虽然强大,但不一定能够满足所有需求。重新训练 LLM 是一种高度定制化的解决方案,通过引入新数据集和调整模型权重,使其更适应特定任务、需求或领域。然而,这种方法需要大量计算资源和数据,并且管理和维护重新训练后的模型也是挑战之一。 Agent 模型 图 10:Agent 模型 Agent 模型是一种构建智能代理的方法,它以 LLM 作为核心控制器。这个系统还包括几个关键组成部分,以提供更全面的智能。 Planning,规划:将大任务分成小任务,这样更容易完成 Memory,反思:通过反思过去的行为,改进未来的计划 Tools,工具使用:代理可以调用外部工具获取更多信息,如调用搜索引擎、计算器等 人工智能代理模型具备强大的语言理解和生成能力,能够解决通用问题,进行任务分解以及自我反思。这使得它在各种应用中都有广泛的潜力。然而,代理模型也存在一些局限性,例如受到上下文长度的限制、长期规划和任务拆分容易出错、输出内容的可靠性不稳定等问题。这些局限性需要长期不断的研究和创新,以进一步拓展代理模型在不同领域的应用。 以上的各种技术并不是相互排斥的,它们可以在训练和增强同一个模型的过程中一起使用。开发者可以充分发挥现有大语言模型的潜力,尝试不同的方法,以满足日益复杂的应用需求。这种综合使用不仅有助于提高模型的性能,还有助于推动 Web3 技术的快速创新和进步。 然而,我们认为,虽然现有的 LLM 已经在 Web3 的快速发展中发挥了重要作用,但在充分尝试这些现有模型(如 OpenAI、Llama 2 以及其他开源 LLM)之前,我们可以从浅入深,从 prompt engineering 和嵌入等 RAG 策略入手,谨慎考虑微调和重新训练基础模型。 3.4 LLM 如何加速区块链数据生产的各个流程 3.4.1 区块链数据的一般处理流程 当今,区块链领域的建设者逐渐认识到数据产品的价值。这一价值覆盖了产品运营监控、预测模型、推荐系统以及数据驱动的应用程序等多个领域。尽管这一认知逐渐增强,但作为数据获取到数据应用中不可或缺的关键步骤,数据处理往往被忽视。 图 12:区块链数据处理流程 将区块链原始非结构化数据,如 events 或 logs 等,转换为结构化的数据 区块链上的每一笔交易或事件都会生成 events 或 logs,这些数据通常是非结构化的。这一步骤是获取数据的第一入口,但数据仍然需要被进一步处理以提取有用信息,得到结构化的原始数据。这包括整理数据、处理异常情况和转化为通用格式。 将结构化的原始数据,转换为具有业务意义的抽象表 在得到结构化原始数据后,需要进一步进行业务抽象,将数据映射到业务实体和指标上,比如交易量、用户量等业务指标,将原始数据转化为对业务和决策有意义的数据。 从抽象表中,计算提取业务指标 有了抽象的业务数据后,可以在业务抽象的数据上进行进一步计算,就可以得出各种重要的衍生指标。例如交易总额的月增长率、用户留存率等核心指标。这些指标可以借助 SQL、Python 等工具实现,更加有可能帮助监控业务健康、了解用户行为和趋势,从而支持决策和战略规划。 3.4.2 区块链数据生成流程加入 LLM 后的优化 LLM 在区块链数据处理中可以解决多个问题,包括但不限于以下内容: 处理非结构化数据: 从交易日志和事件中提取结构化信息:LLM 可以分析区块链的交易日志和事件,提取其中的关键信息,如交易金额、交易方地址、时间戳等,将非结构化数据转化为的带有业务意义的数据,使其更易于分析和理解。 清洗数据,识别异常数据:LLM 可以自动识别和清洗不一致或异常的数据,帮助确保数据的准确性和一致性,从而提高数据质量。 进行业务抽象: 将原始链上数据映射到业务实体:LLM 可以将原始区块链数据映射到业务实体,例如将区块链地址映射到实际用户或资产,从而使业务处理更加直观和有效。 处理非结构化链上内容,打标签:LLM 可以分析非结构化数据,如 Twitter 情感分析结果,将其标记为正面、负面或中性情感,从而帮助用户更好地理解社交媒体上的情感倾向。 自然语言解读数据: 计算核心指标:基于业务抽象,LLM 可以计算核心业务指标,如用户交易量、资产价值、市场份额等,以帮助用户更好地了解其业务的关键性能。 查询数据:LLM 可以通过 AIGC,理解用户意图,生成 SQL 查询,使用户能够以自然语言提出查询请求,而不必编写复杂的 SQL 查询语句。这增加了数据库查询的可访问性。 指标选择、排序和相关性分析:LLM 可以帮助用户选择、排序和分析不同的多个指标,以更好地理解它们之间的关系和相关性,从而支持更深入的数据分析和决策制定。 产生业务抽象的自然语言描述:LLM 可以根据事实数据,生成自然语言摘要或解释,以帮助用户更好地理解业务抽象和数据指标,提高可解释性,并使决策更具合理性。 3.5 目前用例 根据 LLM 自身的技术以及产品体验优势,它可以被应用到不同的链上数据场景,技术上从易到难可以将这些场景分成四类: 数据转换:进行数据增强、重构等操作,如文本摘要、分类、信息抽取。这类应用开发较快,但更适合通用场景,不太适合大量数据的简单批量化处理。 自然语言接口:将 LLM 连接知识库或工具,实现问答或基本工具使用的自动化。这可以用于构建专业聊天机器人,但其实际价值受其所连接的知识库质量等其他因素影响。 工作流自动化:使用 LLM 实现业务流程的标准化和自动化。这可以应用于较复杂的区块链数据处理流程,如解构智能合约运行过程、风险识别等。 协助机器人与助手辅助系统:辅助系统是在自然语言接口的基础上,集成更多数据源和功能的增强系统,大幅提高用户工作效率。 图 11:LLM 应用场景 3.6 LLM 的局限性 3.6.1 行业现状:成熟应用、正在攻克的问题以及尚未解决的挑战 在 Web3 数据领域,尽管已经取得了一些重要的进展,但仍然面临一些挑战。 相对成熟的应用: 使用 LLM 进行信息处理:LLM 等 AI 技术已成功用于生成文本摘要、总结、解释等工作,帮助用户从长篇文章、专业报告中提取关键信息,提高了数据的可读性和可理解性。 使用 AI 解决开发问题:LLM 已经应用于解决开发过程中的问题,例如替代StackOverflow 或搜索引擎,为开发者提供问题解答和编程支持。 有待解决与正在探索的问题: 利用 LLM 生成代码:行业正在努力将 LLM 技术应用于自然语言到 SQL 查询语言的转换,以提高数据库查询的自动化和可理解性。然而,过程中会有很多困难,比如在某些情境下,生成的代码要求极高的准确性,语法必须百分之百正确,以确保程序能够无 bug 运行,并获得正确的结果。难点还包括确保问题回答的成功率、正确率,以及对业务的深刻理解。 数据标注问题:数据标注对于机器学习和深度学习模型的训练至关重要,但在 Web3 数据领域,特别是处理匿名的区块链数据时,标注数据的复杂性较高。 准确性和幻觉(Hallucination)问题:AI 模型中幻觉的出现可能受多因素影响,包括有偏见或不足的训练数据、过度拟合、有限的上下文理解、缺乏领域知识、对抗性攻击和模型架构。研究人员和开发者需要不断改进模型的训练和校准方法,以提高生成文本的可信度和准确性。 利用数据进行业务分析和文章输出:将数据用于业务分析和生成文章仍然是一个具有挑战性的问题。问题的复杂性、需要精心设计的提示(prompt)、以及高质量的数据、数据量、减少幻觉问题的方法都是待解决的问题。 根据业务领域自动索引智能合同数据以进行数据抽象:自动为不同业务领域的智能合同数据建立索引以进行数据抽象仍然是一个未解决的问题。这需要综合考虑不同业务领域的特点,以及数据的多样性和复杂性。 处理时序数据,表格文档数据等更复杂的模态:DALL·E 2 等多模态模型非常擅长在文字生成图像、语音等常见模态。而在区块链以及金融领域需要特别地对待一些时序数据,而非简单地把文本向量化就能解决。联和时序数据与文本,跨模态联合训练等,是实现数据智能分析以及应用的重要研究方向。 3.6.2 为何只靠 LLM 不能完美解决区块链数据行业的问题 作为语言模型,LLM 更适用于处理对流畅度要求较高的场景,而在追求准确性方面,可能需要对模型进行更进一步的调整。在将 LLM 应用于区块链数据行业时,以下框架可提供一些参考。 图 13:区块链数据行业下 LLM 输出的流畅性、准确性和用例风险 在评估 LLM 在不同应用中的适用性时,关注流畅度和准确性是至关重要的。流畅度指的是模型的输出是否自然、通顺,准确性则表示模型的答案是否准确。这两个维度在不同应用场景中有不同的要求。 对于流畅度要求较高的任务,如自然语言生成、创意写作等,LLM 通常能够胜任,因为其在自然语言处理方面的强大性能使其能够生成流畅的文本。 区块链数据面临着数据解析、数据处理、数据应用等多方面的问题。LLM 拥有卓越的语言理解和推理能力,使其成为与区块链数据互动、整理和概括的理想工具。然而,LLM 并不能解决所有区块链数据领域的问题。 在数据处理方面,LLM 更适合快速迭代和探索性处理链上数据,不断尝试新的处理方法。然而,LLM 在生产环境中的详细核对等任务方面仍存在一些限制。典型的问题是 token 长度不够,无法应对长上下文的内容。耗时的 prompt,回答不稳定影响下游任务进而导致成功率不稳定的问题,以及执行大批量任务的效率不高。 其次,LLM 处理内容的过程中很可能出现幻觉问题。据估计,ChatGPT 的幻觉概率约为 15% 至 20%,而由于其处理过程的不透明性,很多错误难以察觉。因此,框架的建立和专家知识的结合变得至关重要。此外,LLM 结合链上数据还是有很多挑战: 链上数据实体类型多、数量庞大,以何种形式投喂给 LLM,有效地运用在具体的商业化场景,类似其他垂直行业,需要更多研究和探索。 链上数据包括结构化和非结构化数据,目前行业大多数数据解决方案,都是基于对业务数据的理解。解析链上数据的过程中,用 ETL 去过滤,清洗,补充和复原业务逻辑,进一步把非结构化数据整理为结构化数据,可以为后期多种业务场景提供更高效的分析。比如,结构化的 DEX trades,NFT marketplace transactions,wallet address portfolio 等,就具有前面提到的高质量,高价值,准确和真实等特点,可以给通用 LLM 提供高效的补充。 被误解的 LLM LLM 可以直接处理非结构化数据,因此结构化数据将不再被需要? LLM 通常基于海量文本数据预训练而来,天然适合处理各类非结构化的文本数据。然而,各个行业已经拥有大量结构化数据,尤其 Web3 领域中解析后的数据。如何有效的利用这些数据,增强 LLM,是一个行业的热门研究课题。 对于 LLM,结构化数据仍然具有以下的优势: 海量:大量的数据储存在各种应用背后的数据库和其他标准格式里面,特别是私有数据。每个公司和行业都还有大量 LLM 没有用于预训练的墙内数据。 已有:这些数据不需要重新生产,投入成本极低,唯一的问题是怎么用起来。 高质量和高价值:领域内长期积累的,蕴含专家的专业知识,通常都沉淀到了结构化数据里面,用于产学研。结构化数据的质量是数据可用性的关键,其中包括数据的完整性、一致性、准确性、唯一性和事实性。 高效率:结构化数据以表格、数据库或其他规范格式存储,模式是预先定义的,并且在整个数据集中保持一致。这意味着数据的格式、类型和关系都是可预测和可控的,使得数据的分析和查询更加简单和可靠。而且,行业已经有成熟的 ETL 及各种数据处理和管理工具,使用起来也更加高效和便捷。LLM 可以通过 API,把这些数据使用起来。 准确性和事实性:LLM 的文本数据,基于 token 概率,目前还不能稳定的输出确切的答案,产生的幻觉问题一直是 LLM 要解决的核心根本问题。对于很多行业和场景,会形成安全和可靠性问题,比如,医疗,金融等。结构化数据,正是可以辅助和矫正LLM 这些问题的一个方向。 体现关系图谱,和特定业务逻辑:不同类型的结构化数据,可以以特定的组织形式(关系型数据库,图数据库等),输入到 LLM,解决不同类型的领域问题。结构化数据使用标准化的查询语言(如 SQL),使得对数据进行复杂的查询和分析变得更加高效和准确。知识图谱 (Knowledge Graph) 可以更好地表达实体之间的关系,也更容易进行关联查询。 使用成本低:不用 LLM 每次重新从底层重新训练整个底座模型,可以结合 Agents 和LLM API 等 LLM 赋能方式,更快更低成本的接入 LLM。 目前市场上还有一些脑洞大开的观点,认为 LLM 在处理文本信息和非结构化信息方面的能力极强,只需将原始数据,包括非结构化数据,简单导入到 LLM,就能达到目的。这个想法类似于要求通用 LLM 解数学题,在没有专门构建数学能力模型的情况下,大多数 LLM 可能会在处理简单的小学加减题时出错。反而,建立类似数学能力模型,和图像生成模型的 Crypto LLM 垂直模型,才是解决 LLM 在 Crypto 领域更落地的实践。 4.2 LLM 可以从新闻、推特等文字信息推测内容,人们不再需要链上数据分析来得出结论? LLM 虽然可以从新闻、社交媒体等文本中获得信息,但直接从链上数据中获得的洞察仍然是不可或缺的,主要原因有: 链上数据是原始的第一手资讯,而新闻和社交媒体中的信息可能存在片面性或误导性。直接分析链上数据可以减少信息偏差。尽管利用 LLM 进行文本分析存在理解偏差的风险,但直接分析链上数据可以减少误读。 链上数据包含全面的历史交互和交易记录,分析可以发现长期趋势和模式。链上数据还可以展现整个生态系统的全貌,如资金流向、各方关系等。这些宏观的洞察有助于更深入地理解状况。而新闻和社交媒体信息通常更零散且短期。 链上数据是开放的。任何人都可以验证分析结果,避免信息的不对称。而新闻和社交媒体未必都如实披露。文本信息和链上数据可以相互验证。综合两者可以形成更立体和准确的判断。 链上数据分析仍是不可或缺的。LLM 从文本中获取信息具有辅助作用,但不能取代直接分析链上数据。充分利用两者优势才能取得最佳效果。 4.3 利用 LangChain、LlamaIndex 或其他 AI 工具,在 LLM 的基础上构建区块链数据解决方案非常容易? LangChain 和 LlamaIndex 等工具为构建自定义的简单 LLM 应用提供了便利,使快速搭建成为可能。然而,将这些工具成功应用于实际生产环境中涉及到更多的挑战。构建一个高效运行、保持高质量的 LLM 应用是一项复杂的任务,需要深入理解区块链技术和 AI 工具的工作原理,并有效地将它们整合在一起。这对于区块链数据行业来说,是一项重要但具有挑战性的工作。 在这个过程中,必须认识到区块链数据的特性,它要求极高的精准性和可重复校验性。一旦数据通过 LLM 进行处理和分析,用户对其准确性和可信度有很高的期望。这与 LLM 的模糊容错性之间存在着潜在的矛盾。因此,在构建区块链数据解决方案时,必须仔细权衡这两方面的需求,以满足用户的期望。 当前市场上,虽然已经有了一些基础工具,但这个领域仍在快速演进和不断迭代。类比于 Web2 世界的发展历程,从最初的 PHP 编程语言到更成熟、可扩展的方案如 Java、Ruby、Python,以及 JavaScript 和 Node.js 等,再到 Go 和 Rust 等新兴技术,都经历了不断的演变。AI 工具也在不断变化,新兴的 GPT 框架如 AutoGPT,Microsft AutoGen,及最近OpenAI 自己推出的 ChatGPT 4.0 Turbo 的 GPTs 和 Agents 等只是展示了未来可能性的一部分。这表明,区块链数据行业和 AI 技术都还有许多发展空间,需要不断努力和创新。 当前在应用 LLM 时,有两个陷阱需要特别注意: 期望值过高:很多人认为 LLM 可以解决一切问题,但实际上 LLM 有明显的局限性。它需要大量的计算资源,训练成本高昂,而且训练过程可能不稳定。对 LLM 的能力要有现实的期望,明白它在某些场景下表现出色,如自然语言处理和文本生成,但在其他领域可能无法胜任。 忽视业务需求:另一个陷阱是强行应用 LLM 技术,而不充分考虑业务需求。在应用 LLM 之前,务必明确具体的业务需求。需要评估 LLM 是否是最佳技术选择,并做好风险评估和控制。强调 LLM 的有效应用需要根据实际情况慎重考虑,避免误用。 尽管 LLM 在许多领域都具备巨大潜力,但开发者和研究者在应用 LLM 时需要保持谨慎,采取开放的探索态度,以找到更适合的应用场景并最大程度地发挥其优势。 关于Footprint Analytics Footprint Analytics是一家区块链数据解决方案提供商。借助尖端的人工智能技术,我们提供 Crypto 领域首家支持无代码数据分析平台以及统一的数据 API,让用户可以快速检索超过 30 条公链生态的 NFT,GameFi 以及 钱包地址资金流追踪数据。 关于Future3 Campus Future3 Campus是由万向区块链实验室和HashKey Capital共同发起的Web3.0创新孵化平台,重点聚焦Web3.0 Massive Adoption、DePIN、AI三大赛道,以上海、粤港澳大湾区、新加坡为主要孵化基地,辐射全球Web3.0生态。同时,Future3 Campus将推出首期5000万美金的种子基金用于Web3.0项目孵化,真正服务于Web3.0领域的创新创业。 来源:金色财经
金色财经
2023-12-06
ChatGPT用户数量已超过17亿 一岁生日后何去何从?
go
己的AI聊天机器人Bard。它由专有的
大型
语言
模型
提供支持,并使用来自网络的信息,以会话方式响应用户的提示。它还可以与Gmail、Docs和YouTube等其他谷歌工具连接,生成个性化回复。 去年11月,亚马逊发布了其AI聊天机器人Q。根据该公司的博客,这款“生成式AI助手”旨在帮助员工简化总结文档、进行研究和生成电子邮件草稿等任务。 工具致力于最终取代智能手机,将信息投射到用户的手上,让用户无需拿着智能手机就能接听电话和执行各种任务。 03.ChatGPT和生成式AI的下一步是什么 AI聊天机器人的未来发展可能意味着,它可以满足你个性化的特定需求。 11月6日,OpenAI宣布用户可以创建定制版本的ChatGPT来满足特定需求,比如解释棋盘游戏或帮助提高写作技能。用户还可以通过OpenAI版本的应用商店与其他用户分享他们的聊天机器人。 哥伦比亚大学工程和数据科学教授Hod Lipson在11月11日接受CNBC采访时表示:“他们真的在努力创造一个市场,让公司和人们能够创新并利用他们刚刚推出的这种令人难以置信的人工智能形式。” 虽然ChatGPT可能帮助普及了AI聊天机器人,但它只是生成式人工智能的一个例子,生成式人工智能指的是经过大量数据训练的技术,这样它就可以创建新的内容,比如文章或图像。OpenAI的DALL-E人工智能系统就是一个例子,该系统能够根据用户输入的文本创建图片。 纽约大学兼职教授Jamyn Edis在科技和媒体行业拥有超过25年的经验,他表示,尽管生成式人工智能应用在过去一年里发展迅速,但这种速度可能无法持续下去。 他在接受CNBC Make It采访时表示:“你需要数据来为机器提供信息,随着我们试图摄取越来越多的文本、图像、视频和其他媒体格式和数据集,在某一点上,你将开始走向地平线的边缘。到那时,由于所有新内容都是基于旧内容,它是否会变成一只追逐自己尾巴的狗?” 至于OpenAI,根据11月9日的一篇博客文章,该公司的目标是创建公共和私人数据集,帮助人工智能模型更深入地了解广泛的主题、语言和文化。 为了做到这一点,该公司正在寻找一种无法在网上找到的“反映人类社会”的数据,比如人类对话。 OpenAI写道:“我们正在寻找合作伙伴,帮助我们教会人工智能理解我们的世界,以便最大限度地帮助每个人。” 来源:金色财经
金色财经
2023-12-05
上一页
1
•••
61
62
63
64
65
•••
109
下一页
24小时热点
特朗普突发重磅!华尔街日报独家爆料:特朗普推迟“对等关税”的原因在这
中国突传重磅!彭博独家:李嘉诚的港口交易令其子进军大陆保险业的谈判停滞
中国房市突传大消息!传闻下周将举行高层会议来救市 中国房地产股飙升
美联储会议纪要释放“鹰派信号”,7月降息“泡汤”?
特朗普关税重大宣布!美国将对巴西征收50%关税 巴西资产应声暴跌
最新话题
更多
#Web3项目情报站#
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
36讨论
#链上风云#
109讨论
#VIP会员尊享#
1989讨论
#CES 2025国际消费电子展#
21讨论