Crypto 是 AI 的幻觉

原文作者:佐爷原文来源:佐爷歪脖山涌现(emergence):当许多小的个体相互作用后产生了大的整体,而这个整体展现了构成它的个体所不具备的新特

涌现(emergence):当许多小的个体相互作用后产生了大的整体,而这个整体展现了构成它的个体所不具备的新特性的现象,比如,生物学所研究的生命现象是化学的一个涌现特性。幻觉(Hallucination):模型有输出欺骗性数据的倾向,AI 模型的输出看起来是正确的,实际上是错误的。

AI 和 Crypto 的链接呈现出明显的波段起伏特征,在 2016 年 AlphaGo 战胜人类围棋职业选手后,加密世界自发诞生了 Fetch.AI 等将两者结合的尝试,自从 2023 年 GPT-4 的横空出世,这种 AI + Crypto 的热潮再起,以 WorldCoin 发币为代表,人类似乎要进入一个 AI 负责生产力,Crypto 负责分配的乌托邦时代。

这种情绪在 OpenAI 推出文生视频应用 Sora 后达到高潮,但既然是情绪,总有不理性的成分在,至少李一舟就属于被误伤的那一部分,比如

我在本文会聚焦 Crypto 能为 AI 增益之处,当前主打 AI 应用的 Crypto 项目主要是噱头,不便纳入讨论。

从线性回归到 Transformer

长期以来,涉及 AI 话题的焦点是人工智能的“涌现”会不会造就《黑客帝国》中的机械智能体或者硅基文明,在人类和 AI 技术的相处上,此类担忧一直存在,最近的是在 Sora 问世后,而稍早前也有 GPT-4(2023)、AlphaGo(2016)和 1997 年IBM 的深蓝击败国际象棋。

此类担忧从未成真也是事实,不如放松心态,简要梳理下 AI 的作用机制。

我们从线性回归出发,其实就是一元一次方程,比如贾玲的减肥机制,就可以做如下归纳,x 和 y 分别代表摄入能量和体重的关系,即吃的越多自然长得越胖,如果要减肥那么就要少吃。

但是,这样会带来一些问题,第一,人类的身高和体重有生理极限, 3 米巨人和千斤大小姐不太容易出现,因此考虑极限以外的情况缺乏意义;第二,单纯的少吃多练,并不符合减肥的科学原理,严重时会损害身体。

我们引入 BMI (Body Mass Index)身体质量指数,即体重除以身高的平方来衡量二者的合理关系,并且通过吃、睡、练三个因子来衡量身高和体重的关系,因此我们需要三个参数和两个输出,明显线性回归是不够用的,神经网络就此诞生,顾名思义,神经网络模仿的是人脑结构,思考次数越多,也有可能越合理,三思而后行,加多加深思考的次数,即深度学习(我牵强附会乱说的,大家理解意思就好)

幻觉是啥_最常见的幻觉是_

AI 算法发展史简要说明

但是层数的加深也不是无止境的,天花板依然存在,达到某个临界值可能效果就会变差,因此通过更合理的方式理解既有信息之间的关系就变得很重要,比如深刻理解身高和体重之间更细致的关系,找到以往没发现的因子,再或者贾玲找到顶级教练,但是不好意思直说想减肥,那么就需要教练揣摩下贾玲到底啥意思。

幻觉是啥__最常见的幻觉是

减肥的意思

在这种场景下,贾玲和教练构成编码和解码的对手,来回传递的意思代表了双方的真正含义,但是不同于“我要减肥,给教练送礼”的直白,双方真正的意图被“意思”隐藏了起来。

我们注意到一个事实,如果双方往复的次数够多,那么各个“意思”的含义也就更容易猜出来,并且各个意思和贾玲和教练的关系也会越来越明确。

如果将这个模型扩展,那就是通俗意思上的大模型(LLM,large language model),更精确的说是大语言模型,考察的是词句之间的上下文关系,但是目前的大模型都被扩展,可以涉足图像、视频之类的场景。

在 AI 的光谱中,不论是简单的线性回归还是极其复杂的 Transformer 都是算法或模型的一种,除此之外,还有算力和数据两个要素。

_最常见的幻觉是_幻觉是啥

说明:AI 简要发展史 图源:

简单来说,AI 就是吞吐数据,进行运算,导出结果的机器,只不过和机器人等实物相比,AI 更虚拟一些,在算力、数据和模型三部分上,目前 Web2 商业化运作流程如下:

幻觉是啥_最常见的幻觉是_

AI 运作过程

如前所述,AI 应用领域广泛,比如 Vitalik 所说的代码修正早已经投入使用,如果换个视角,Crypto 能为 AI 做的主要集中在非技术领域,比如去中心化的数据市场、去中心化的算力平台等等,去中心化的 LLM 有一些实践,但是要注意,用 AI 分析 Crypto 代码和区块链上大规模跑 AI 模型根本不是一回事,以及在 AI 模型中加一些 Crypto 因素也很难称得上是完美结合。

Crypro 目前还是更擅长生产和激励,异想天开用 Crypto 强行改变 AI 的生产范式则大可不必,这属于为赋新词强说愁,拿着锤子找钉子,Crypto 融入 AI 的工作流以及 AI 赋能 Crypto 才是合理选择,以下是我总结的比较可能的结合点:

去中心化的数据生产,比如 DePIN 的数据采集,以及链上数据的开放性,蕴藏着交易数据的富矿,可用于金融分析、安全分析和训练数据;去中心化的预处理平台,传统预训练并无不可攀越的技术壁垒,而在欧美大模型的背后,是第三世界人工标注员的高强度劳动;去中心化的算力平台,个人带宽、GPU 算力等软硬件资源的去中心化激励和使用;zkML,传统的数据脱敏等隐私手段并不能完美解决问题,zkML 可以隐藏数据指向性,也可以有效评估开源和闭源模型的真实性和有效性;

这四个角度是我能想到的 Crypto 能为 AI 赋能的场景,AI 是通用工具,AI For Crypto 的领域和项目就不再赘述,大家可以自行研究。

可以发现,Crypto 目前主要在加密、隐私保护和经济学设计上发挥作用,技术结合点只有 zkML 有一些尝试,这里可以开一下脑洞,如果未来 Solana TPS 真能跑到 10 万+,Filecoin 和 Solana 结合又比较完美的话,能不能打造一个链上 LLM 环境,这样能打造出一个真实的链上 AI,改变目前的 Crypto 附着于 AI,两者地位不对等的关系呢?

Web3 加入 AI 工作流

无需多言,英伟达 RTX 4090 显卡是硬通货,目前的某个东方大国很难获得,但是更严重的是,个人、小公司和学术机构也遭遇了显卡危机,毕竟大型商业公司才是氪金玩家,如果能在自购、云厂商之外开辟第三条道路,很明显具备实际的商业价值,也就脱离了纯粹的炒作,合理的逻辑应该是“如果不用 Web3,则无法维持项目运作”,这种才是 Web3 For AI 的正确姿势。

最常见的幻觉是__幻觉是啥

Web3 视角下的 AI 工作流

数据之源:Grass 和 DePIN 汽车全家桶

Grass 由 Wynd Network 推出,Wynd Network是一个闲置带宽售卖市场,Grass 是一个开放式的网络数据获取和分发渠道,不同于单纯的数据收集和售卖,Grass 具备将数据清洗和验证功能,以规避越来越封闭的网络环境,不仅如此,Grass 希望能直接对接上 AI 模型,为其提供直接可用的数据集,AI 的数据集需要专业处理,比如大量的人工微调,以满足 AI 模型的特殊需求。

扩展一下,Grass 要解决数据售卖的问题,而 Web3 的 DePIN 领域能生产 AI 需要的数据,主要集中在汽车的自动驾驶上,传统上的自动驾驶需要对应公司自行积累数据,而 DIMO、Hivemapper 等项目直接运行在汽车之上,采集越来越多的汽车驾驶信息和道路数据。

在以往的自动驾驶中,需要汽车识别技术和高精地图两部分,而高精地图等信息被四维图新等公司长期积累,形成事实上的行业壁垒,如果后来者借助 Web3 数据反而具备弯道超车的机会。

数据预处理:解放被 AI 奴役的人类

人工智能可以分成人工标注和智能算法两部分,第三世界,如肯尼亚和菲律宾等地区负责人工标注等价值曲线最低的部分,而欧美的 AI 预处理公司拿走大头收入,进而出售给 AI 研发企业。

随着 AI 的发展,更多的企业盯上这部分业务,在竞争下数据标注的单价越来越低,该部分业务主要就是给数据打标签,类似识别验证码的工作,并无技术门槛,甚至有 0.01 元人民币的超低价。

最常见的幻觉是__幻觉是啥

图源:

在这种情况下,诸如 Public AI 等 Web3 数据标注平台也具备实际商业市场,链接 AI 企业和数据标注民工,使用激励体系取代单纯的商业低价竞争模式,但是要注意,Scale AI 等成熟企业的标注技术保证可靠的质量,而去中心化的数据标注平台如何控制质量,禁止撸毛党则是绝对刚需,本质上这是 C2B2B 的企业服务,单纯的数据规模和数量并不能说服企业。

硬件自由:Render Network 和 Bittensor

需要说明,跟比特币矿机不同,目前没有专用的 Web3 AI 硬件,现存的算力、计算平台都是成熟硬件叠加 Crypto 激励层改造而来,本质上可以归纳为 DePIN 领域,但是和数据来源项目有所区别,故按照 AI 工作流写在此处。

DePIN 定义可参考我之前写的文章:Helium 之前的 DePIN 往事,比特币、Arweave 和 STEPN

Render Network 是“老项目”,并不完全为 AI 准备,最早致力于渲染工作,一如 Render 之名,2017 年开始运营,当时的 GPU 还没那么疯狂,但是市场机遇已经逐步出现,GPU 显卡市场,尤其是高端显卡被英伟达垄断,高昂的价格阻碍渲染、AI 和元宇宙使用者的进入,如果能在需求方和供给方构建起通道,那么类似共享单车的经济模型就有机会成立。

并且 GPU 资源并不需要实际交接硬件,仅调配软件资源即可,更值得一提的是,Render Network 在2023 年便转投 Solana生态,舍弃 Polygon,在 Solana 并未回暖之时的投奔也被时间证明是正确之举,对于 GPU 使用和分配而言,高速网络是一种刚需。

如果说 Render Network 是老项目,那么 Bittensor 则风头正盛。

BitTensor 建构在波卡之上,其目标是通过经济激励训练 AI 模型,比拼各节点能否将 AI 模型训练至误差最小或者效率最高,也是较为符合经典的 AI 上链流程的 Crypto 项目,但是真正的训练过程依然需要英伟达 GPU 和传统平台,整体上类似 Kaggle 等竞赛平台。

zkML 和 UBI:Worldcoin 的 AB 面

零知识机器学习(zkML)通过将 zk 技术引入 AI 模型训练过程,以此来解决数据泄露、隐私失效和模型验真的问题,前两者容易理解,zk 加密后的数据仍然可以被训练,但是不会再泄露个人或者隐私数据。

模型验真是指某些闭源模型的评估问题,在 zk 技术加持下,可以设定某个目标值,那么闭源模型可以通过验证结果的方式证明自己的能力,而无需公开计算过程。

Worldcoin 不仅是较早设想 zkML 的主流项目,还是 UBI(人类基本收入)的拥趸,在其设想中,未来 AI 的生产力将远超人类的需求上限,因此真正的问题在于公平分配 AI 的福利,UBI 的理念将通过 $WLD 代币像全球用户分享,因此必须进行实人生物识别,以遵循公平原则。

当然,目前的 zkML 和 UBI 还在早期实验阶段,但是足够有趣,我会持续关注。

结语

AI 的发展,以 Transformer 和 LLM 为代表的路线发展也会逐渐陷入瓶颈,一如线性回归和神经网络,毕竟不可能无限制增加模型参数或者数据量,继续增加的边际收益会递减。

AI 也许是涌现出智慧的种子选手,但现在幻觉问题十分严重,其实可以看出,目前认为 Crypto 能改变 AI 的幻觉是一种自信,同时也是一种标准的幻觉,Crypto 的加入很难从技术上解决幻觉问题,但至少可以从公平、透明角度入手改变一些现状。

参考文献:

OpenAI: “GPT-4 Technical Report”, 2023; arXiv:2303。08774。Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N。 Gomez, Lukasz Kaiser, Illia Polosukhin: “Attention Is All You Need”, 2017; arXiv:1706。03762。Jared Kaplan, Sam McCandlish, Tom Henighan, Tom B。 Brown, Benjamin Chess, Rewon Child, Scott Gray, Alec Radford, Jeffrey Wu, Dario Amodei: “Scaling Laws for Neural Language Models”, 2020; arXiv:2001。08361。Hao Liu, Wilson Yan, Matei Zaharia, Pieter Abbeel: “World Model on Million-Length Video And Language With RingAttention”, 2024; arXiv:2402。

08268。Max Roser (2022) – “The brief history of artificial intelligence: The world has changed fast – what might be next?” Published online at OurWorldInData。org。 Retrieved from: ‘https://ourworldindata。org/brief-history-of-ai’ [Online Resource]An introduction to zero-knowledge machine learning (ZKML)Understanding the Intersection of Crypto and AIGrass is the Data Layer of AIBittensor: A Peer-to-Peer Intelligence Market

Author:BticoinKOL,Source:https://bitcoinkol.com/archives/4117

Like (0)
Previous 25/02/2024 7:08 pm
Next 26/02/2024 1:19 am

相关推荐

  • Bankless:狂热的Meme币投资者指南

    原文标题:An Investor Guide to Meme Mania。这是一个由四部分组成的计划,也许有机会获得Meme币的财富。

    22/03/2024
    00
  • 观点:加密风险投资中重要的是抢占叙事先机

    原文作者:@reganbozman 原文来源:X编译:白话区块链在风险投资界,被广泛接受的观点是通过持有与主流相悖但又正确的观点来获得利润。然而

    Industry dynamics 20/03/2024
    00
  • BABYDOGE持幣地址破100萬,會上幣安嗎?

    昨天整個行情裏,BABYDOGE最吸引目光! 這個人氣動物暴漲40%,最近明顯有資金運作,持幣地址居然增長到110萬了,與SHIB不相上下。 再接再勵,有希望來次大行情,創出歷史新高。 BABYDOGE(寶貝狗)簡介 “BABYDOGE”於2021年6月推出,是同類加密貨幣中增長最快的加密貨幣。 BABYDOGE是分散的,其任務是給普通人提供加密密碼,同時也幫助拯救有需要的人。 BABYDOGE是一枚超級狗狗硬幣,具有10倍的速度塊速度和更便宜的交易費用,因為它建立在綁定智慧鏈上。 Baby Doge Coin擁有通縮機制,每一筆交易都將產生獎勵,分配給所有持幣地址,所以你將會得到更多的硬幣。 所以每次交易中有更多的BABYDOGE被自動添加到你的錢包裏。 BABYDOGE包括但不限於整個項目、權杖、網站、智慧契约和本概念檔案中提出的任何應用程序(“BABYDOGE”),都不是任何類型的、未經許可的或豁免的金融或支付服務。 BABYDOGE是一個分散化和社區驅動的項目,沒有所有者、股東、推廣者、行銷人員、經理、董事或其他人物或實體發揮任何形式的治理。 BABYDOGE智慧合約是開源的、安全稽核的、永久的和不可修改的。 BABYDOGE權杖在所有司法管轄區都嚴格地是一種實用工具,不是也不能被認為是任何類型的“安全”或其他監管權杖。 沒有以任何管道電子錢和/或法定貨幣,或資產支持穩定幣,無論是全球性的還是有限的。 BABYDOGE是第一個直接在網站上進行實时分散交換的模因硬幣之一。 BABYDOGE卡支付是第一個表情包硬幣的信用卡加密支付直接在網站上。 BABYDOGE與DOGE BaByDoge在社交媒體上頻頻出現,並且打著馬斯克的旂號瘋狂文宣。 這讓不少人開始好奇,這個名字一看就和Doge有密不可分關係的BaByDoge究竟是何方神聖? 它和馬斯克又有什麼關係? Doge Coin是Baby Doge Coin的父親。 Baby Doge Coin這個全新的硬幣起源於Doge Coin社區粉絲。 它與狗狗幣的區別在於Baby Doge Coin擁有更快的交易速度和更可愛的樣子。 和之前火熱的動物幣的模式如出一轍,據BaByDoge白皮書介紹,BaByDoge總發行量為42萬萬億枚,用戶的每次交易,其交易總數的5%將重新分配給BaByDoge的持有者,此外還有2.5%將會被燃燒掉。 BABYDOGE有何優勢? 從白皮書上看,BaByDoge看起來和此前的諸多動物幣並無太大區別,為什麼在動物幣熱度退散的當下,BaByDoge又能掀起一波熱潮呢? 據瞭解,BaByDoge項目創始人Doge father本名Christian Campisi,是一名外國慈善家,上過福布斯,擁有三家慈善電商企業,長期為流浪狗捐款。 據他所說,其創建BaByDoge的目的就是更好地做慈善; 不過,參與BaByDoge的玩家們似乎對BaByDoge的慈善内容並不感冒,真正引起玩家們參與興趣的,是包括馬斯克以及一眾明星在內的文宣和有趣的推廣。 據瞭解,除了馬斯克的“喊單”外,推特上同樣也有多個大V為BaByDoge搖旗呐喊,如著名的說唱歌手,推特粉絲520萬+的Souljia Boy、DogeCoin的推廣大使DailyDogeUpdate、推特粉絲80萬+的美國著名橄欖球運動員Zach BoyChuk、美國網紅PerezHilton等等…… 另外,Babydoge的通縮機制幣種也值得一提。 這種全新的通縮機制幣種並不是第一次出現在幣圈,對於這個Babydoge幣種如果你决定投資購買的話,建議你首先認真弄清楚它的規則制度,避免造成不必要的損失。 Babydoge官方表示:現時我們只有67%的供應量,在一個月內將會有10%從行銷錢包中燒掉,即剩下47%。 在接下來的六個月裏,我們將通過交易自動燃燒,所以大約是18-20%。 現在我們有67%的供應,這意味著六個月後將剩下30%。 如果您現在出售,六個月後將是一大損失,如果您不知道出售的原因,請不要讓鯨魚操縱您。 不要每秒查看圖表。 鯨魚知道這個項目之後的成長有多大,一旦你賣出,你需要額外花費24%才能回來。 babydoge區塊速度比doge快10倍,這就是為什麼Elon Musk給我們發推文。 “通過這些不難看出隨著時間的推移babydoge是一個不斷通縮的幣種,並且它的買賣機制讓交易的成本變得很高。這會讓一些做波段的人望而卻步。接下來babydoge肯定會加大行銷。是否會成為下一個狗狗幣讓我們拭目以待吧。 BABYDOGE這次上漲原因? 1月2日,據官方消息,Baby Doge於美東時間1月1號銷毀5000萬億枚代幣,總價值約1150萬美金。 大批量通縮推動幣價飆升15%。 項目方每個月1號都會例行銷毀代幣,每進行一筆交易都會將2.5%返回資金池,5%分紅給持幣者,2.5%再次銷毀。 其次,babydoge官推1月1日轉發bn關於babydoge價格圖表。 1月2日,幣安網創始人cz發推表示“幣安今年應該上架什麼?” babydoge官推轉發回復“100萬持幣人的babydoge你怎麼看?” 囙此,很多人猜測babydoge可能要上幣安,這也是這次代幣價格上漲原因之一。 寫在最後 截止今日淩晨,寶貝狗Babydoge走牛,ELON,SAFEMOON都牛,動物幣沒想到能提前走出獨立行情。 大餅真是扯後腿,這樣很影響操作好幣,太謹慎了,提前走牛的容易錯過。 畢竟以前都是大餅先牛,其它才慢慢跟上,那種節奏好搞,現在局部先於大盤走牛,得改變思路,與時俱進。 做強勢幣,大盤不太好,就做獨立行情的幣,趁大盤回檔低吸。 另外,截止編輯文章時,people崛起,FREE也在低位反包,dao龍頭PEOPLE好於預期! 因為前兩日BABYDOGE的暴漲,PEOPLE也算MEME幣,今天介入people,帶上止損即可,因為防止只是技術性反彈,有了籌碼,走走看,不排除是真正起來了。 最後還是要提醒大家,雖說babydoge確實很火,但各位幣友還是需要控制好風險,控制好倉位,投資需謹慎!

    03/01/2022
    00
  • 机构们的价格漫谈:比特币的“顶”在哪里?

    原文作者:陀螺财经 原文来源:陀螺财经比特币的狂热还在持续。2月以来,比特币一路飙升。2月20日突破5万美元,2月28日突破6万美元,3月5日突

    Industry dynamics 14/03/2024
    00
  • Foresight Ventures : 坎昆升级来临,哪些L2做了适配?

    原文作者:Maggie原文来源:Foresight VenturesTL;DR:坎昆升级将于2024 年 3 月 13 日推出,EIP4844即

    14/03/2024
    00
  • 详解 1intro:Solana 的首个 LBP 平台,弥补生态空白的新机会

    原文作者:Ash 原文来源:X编译:深潮TechFlowLBP 是Liquid Bootstrap Pool 的简称,流动性启动池,亦称为荷兰式

    01/04/2024
    00
  • 空投爱好者必备的开发知识有哪些?

    原文作者:Wyz Research原文来源:Wyz Research懂得开发部署知识,让用户小白成为BUIDL。当你不会部署合约的时候,你可能不

    22/03/2024
    00
  • 福布斯:为什么 ETH ETF 可能会被推迟?

    原文标题:Why An ETH ETF Might Be Delayed After All 原文作者:Sean Stein Smith 原文来

    Industry dynamics 25/03/2024
    00

Leave a Reply

Your email address will not be published. Required fields are marked *