Twitter Space回顾 | 大模型时代下,大家觉得自己的工作会被取代吗?
摘要: 在当前的快速发展的环境中,创业者们应该尽快行动,而不是等待一切都准备完备再开始。
GPT DAO是最硬核的AGI信息分享社区,专注于深度和硬核信息分享。北京时间2023年6月24日晚9点,GPT DAO &新加坡Sub DAO联合举办了主题为【大模型时代下,大家觉得自己的工作会被取代吗?】的Twitter Space。
本次活动由GPT 新加坡Sub DAO发起,主持人是GPT DAO的核心成员,以及LK Ventures的Venture Partner Zoie Zhang。特邀嘉宾包括于佳宁,UWEB的校长、中国通信工业协会区块链专委会的共同主席以及中国移动通信联合会元宇宙产业委员会的执行主任;黄连金,美国Distributedapps.ai公司的CEO、中国电子学会区块链分会的专家委员,同时也是《区块链与Web3:元宇宙的安全和隐私基础技术》的作者;白强,GPT DAO的核心成员,从Web1到Web3漫游世界的创业者投资人,中国科大数学/美国普渡大学数理统计,曾担任科大讯飞的联合负责人。此外,由北拓资本投资银行部的高级副总裁Ryker担任Co-Host,链得得ChainDD的华东区执行副主编道尔吉和博链财经的创始人、1783DAO的发起人王晖作为媒体观察团出席本次活动。
我们梳理了本场 AMA 精华内容,以飨读者。
Q1:于校长,最近你以AI专家的身份参加了央视财经频道的《经济半小时》,那么想请问你,在AIGC和互联网3.0的未来黄金十年,你认为新的职场机遇有哪些呢?
于佳宁:
首先,人工智能预训练模型需要大量的人工标记。这就为那些没有高学历或者技术背景的人提供了机会。只要他们有基本的常识判断,就可以作为AI标记员或者AI培训师。比如说,我们在山西的一个贫困县的人才基地看到,一些家庭妇女和留守的人口,通过从事AI的标记工作,实现了收入的增加。
其次,随着AI的发展,新的职业角色不断涌现。比如说提示词工程师,他们通过自然语言与机器进行交互,为整个行业带来了变革。这些新角色的出现,也使得职业发展路径有了更多的可能性。
再有,我注意到苹果公司新推出的产品vision Pro,这款产品不仅仅是一款娱乐设备,而更是一款生产工具,一款创作工具。我认为,它可能会带动空间计算基于三维视频和三维图像的创作的发展,为内容创作者提供了新的工具。
最后,我认为AI在快速创造出大量内容的同时,也在极大地侵蚀内容的价值。不过,新的内容生产方式,新的内容媒介也在快速成长,带来了新的机会。虽然AI有替代效应,但它也有补偿效应。我相信在AI的大浪潮下,人类社会的财富总量会增加,不会减少。这就为我们提供了把握新的职业机会,实现自身发展的可能。
在这个大背景下,我鼓励大家要有自己的判断和选择,要明确自己在未来AI时代可以做什么,而不是人云亦云。通过深入理解和思考这个时代的变化,我们才能在新的颠覆浪潮中找到自己的位置。
Q2:我们常常和LLM创业者聊的时候,发现大家遇到的常见的瓶颈是很难快速找到最适合自己的大语言模型,又或者是缺乏数据去训练模型,对于这个您有什么建议给到创业者突破这些瓶颈呢?你如何看待创业团队如何克服AI算力的局限性的?
黄连金:
我认为创业团队应结合自己的资源和技术能力,选择最适合自己的大语言模型,并通过积累数据、微调模型等方式提升模型的性能。同时,通过选择合适的部署平台,购买GPU等方式来尽可能克服AI算力的局限性。大部分初创公司可能将像ChatGPT、GPT 4或者GPT 3.5这样的大语言模型作为自己的底层技术,通过API进行调用和查询。然而,这样的方式其实是一种相对简单的设计模式,但我建议初创公司要注意自己的数据沉淀。没有数据是个问题,要尽可能把数据留在自己手中。同时,为了保障数据安全,可以选择利用微软的Azure AI进行部署。
其次,如果你作为创业者有一定的技术能力,你其实可以建立一个属于自己的基础模型。你可以利用OpenAI的模型生成优质的数据,然后建立一个基础模型,并对其进行微调。这样可以更好地服务于中小企业。我建议考虑使用开源模型。有些开源模型是可以进行商业应用的,比如Facebook的一些模型。但同时你也需要注意,有些模型只能做研究用途,不能用于商业应用。如果你有足够的资本,你可以选择购买大量的GPU,甚至创建自己的GPU云。这样做可以比其他的云服务更加便宜。或者,如果你在芯片设计方面有优势,你可以考虑设计出更大的芯片,去和像英伟达这样的公司竞争。
白强:
在当前的快速发展的环境中,创业者们应该尽快行动,而不是等待一切都准备完备再开始。这就像我们1994年开始创业一样,一切都在于速度。如果你能把你的项目尽快上线,那么你就有机会在接下来的运营过程中收集到新的数据,然后用这些数据去训练你的模型,做你该做的事情。在当前的起步阶段,即使没有条件,也要创造条件快速上线,因为速度就决定了一切。
Q3:互联网上经常有关于“科大讯飞能否成为中国版ChatGPT”的讨论出现,上个月又因为GPT合成的不实报道文章导致科大讯飞股价出现震荡,您如何看待科大讯飞在这一波AI浪潮中的布局?以及您认为这一拨AI浪潮,为中国创业者带来了什么机会?(To白强)
白强:
在这个问题上,我认为情况是相当严峻的。我和一些在人工智能领域有影响力的华人朋友们交流,他们也认同,中国在大模型的发展上,当前正处于不断快速落后的状态。一位国务院政策研究室的主任也在文章中明确指出了这一点,这是我们都认可的观点。首先,在技术层面,我们已经明显落后。这些年来,我们在模式创新、ToC立即产品等方面表现出色,中国团队的效率我认为是世界最强的。然而,当涉及到底层的研究,这一直是我们的短板,所以我们在技术层面已经落后了。其次,数据的问题也非常严重。中文的高质量数据并不多,原因很多,比如,由于APP发达,数据更加分散,而且大家都在保密自己的数据,不愿让别人挖掘,因此我们在数据方面也已经落后了。例如,OpenAI可以获取的数据远超过我们。我自己用过GPT,感觉它的中文水平很差,英文水平则相对强很多。实际上,这也是因为GPT没有足够好的数据来训练它的中文模型。可用于训练的中文数据只有英文的1%,这就是数据方面的差距。
我们在算力方面也面临挑战。现在很多公司还有很多GPU,也在不断地走私进来,但实际上,怎么有效地使用GPU并不是简单的插入电脑就行了,它需要有相应的使用方式、组合和管理才能发挥最大的效果。我们虽然有腾讯云、阿里云等云计算平台,但在GPU布局、使用效率上,我们现在还处于落后状态。而且,由于各种限制越来越严,获取新的英伟达芯片也将越来越困难,所以这方面的落后是无法避免的。由于这三个原因,我对当前的情况感到非常悲哀。尽管我们有80多家都在做大模型,但真正能有像ChatGPT这样的实用产品并未出现。近期的情况看来,我们在这方面的落后还在加速。然而,从另一方面看,由于OpenAI不对中国等国家开放,这就决定了我们必须自己发展大模型。理论上,如果我们能够利用中国的特点,宏观调控,集中人力、数据、算力,最终产生一个大模型,特别是中文水平超过GPT的大模型,那将是非常合理且有可能的。但现在看来,各公司各自为战,合力的可能性很小,所以从这个角度看,我对未来仍然保持悲观。
Ryker Fu:
以我们北拓为例,我们关注的方向是数据和模型服务这一块。我认为数据非常重要。对于国内大家的模型效果究竟谁更好,很难评判,尤其是在b端企业落地的时候。B端企业可能很难判断是百度的还是微信的更好,或者是阿里的更好,还是智源智普的更好。他们更多的时候是考虑谁能更好地结合我公司自己的数据,把服务应用做好,谁的落地成本比较低。比如,我们最近非常看好的一家公司,它专门服务于未来的大模型数据领域。它专门帮助企业做海量非结构化数据的治理和清洗,帮助企业把那些存放在硬盘角落里,原有的、未被利用起来的数据,形成高质量、个性化的QA语料。然后再去跟通用大模型或开源模型合作,在b端落地,这可能是我们最近看到的比较好的商业模式。除此之外,在应用层面,我们更关注一些垂直领域的创新。这是我想要补充的一点。
Q4:对于AI和Web3的结合,你认为哪些行业或领域最有可能发生重大变革?
白强:
在Web 3和AI的背景下,数据本身非常有价值。如何让数据产生价值,我认为只有通过Web 3才能实现。比如,我们最近关注了一个项目,它是由斯坦福和MIT的华人团队做的AI家居设计。尽管他们的设计很出色,但是在整个设计过程中,你花费了大量的精力,但最后产生的数据都属于公司,公司认为这是他们的护城河。然而我认为,这些数据应该被分享出来,给予产生数据的人一些收益,这只能通过Web 3来实现。因此,我们认为,Web 3和AI的结合在本质上就是Web 3能够把AI中不易赚钱的事物变得有利可图。
于佳宁:
我相信AI和区块链在未来的发展中将会扮演非常重要的角色。AI是一种改变生产力的技术,而区块链是一种能改变生产关系的技术。这个观点在我2018年首次听闻时感到有些迷惑,但通过深度使用ChatGPT并研究OpenAI后,我开始赞同这个看法。尤其是当我发现Sam Altman创建了一个名为worldcoin的项目,我对区块链在财富分配上的可能性有了更深刻的理解。我发现AI的迅速发展可能导致大量的工作失业,特别是对于那些在AI时代下没有充分融合技能和工作方式的年轻人。我们不能忽视这个问题,否则可能会导致社会动荡,甚至大规模失业。为了避免这种情况,我相信必须实行普遍基本收入(UBI)。Sam提出应该将所有AI公司的股票打包成一个ETF,由政府持有并分配这个ETF,这样可以让每个人都能分享到AI的发展红利。这个想法让我意识到AI可以用于创造新的财富和提高效率,而区块链和Web 3则可以用来有效地分配这些财富和价值。在AI时代,我们的数据是最有价值的资产。我们不能再忍受只贡献数据但无法从中获取收益的情况。我们需要使用Web 3和区块链技术来分配这些数据产生的价值。看起来很多之前被人们认为是笑话的事情,如空投、数据挖矿等,其实在AI时代变得至关重要。
因此,Sam通过他的职业选择、他的经历以及他的创业方向给我们展示了一个可能的未来:使用AI来创造新的财富和提高效率,而利用区块链和Web 3来有效地分配这些财富和价值。这可能是人类社会在未来面临的一个重要解决方案。
黄连金:
我稍微展开一下,Sam Altman在演讲中提出了一些让人深思的观点,暗示了他为何要推动创建Worldcoin。他提出,不应该过度信任OpenAI或者他自己,而是应该依赖去中心化以获得真正的信任。在这个体系中,任何人都可以验证和确定技术的可信度,这与Worldcoin的设计有关,让持有Worldcoin的人能够验证这种模型。
他也提出了AI技术快速发展,生产力大幅度提高,将会导致很多人失去工作,这一点印象深刻。我个人认为,在将来的公司,可能只需要很少的人就可以运行,因为有AI助手的帮助,即使是十几个人也可以创建一个价值数十亿的公司。然而,这也意味着很多人可能会失业。
这就引出了普遍基本收入(UBI)的概念,因为如果AI在全世界范围内普及,由于其传播能力和部署规模,可能会导致大规模的失业。为了解决这个问题,我们可能需要实行UBI,这可能意味着人们未来只需要三天或四天工作。有些国家已经实施了四天工作制,这可能是一个解决方案。另一个有趣的概念是通过AI进行虹膜扫描来验证个人身份,这是一种使用AI生成内容与人类生成内容进行区分的方法。这个技术可能会引发一些隐私问题,但是,Sam Altman确保这些信息只存储在用户自己的设备上,而不是在服务器上,他还提出了一系列零知识证明的解决方案。
在我看来,OpenAI和Worldcoin可能在未来会联合起来。OpenAI作为一个非营利组织,当达到一定程度的利润后,它将不再追求盈利,而是将这些盈利作为UBI进行分发。这可能是他们为解决未来可能的失业问题提出的一个解决方案。
Q5:在AI大模型时代,你认为哪些行业或工作岗位最有可能被AI替代?对于AI和人类之间的协作,你认为我们应该如何更好的平衡这种工作关系已达到最优的产出?
黄连金:
AI正在渗透到我们生活和工作的各个方面。一方面,AI对于各行各业的影响已经开始显现,尤其是在美术设计行业,如midjourney stable diffusion已经能够进行广告设计和游戏设计,这使得曾经需要大量美术设计师才能完成的工作现在只需要极少的人力。在法律行业,AI也开始发挥作用,比如LLM训练模型和AI法律助手,他们都可以产生高质量的案例,但AI并不能完全替代人类,人类的参与和监督仍然是必要的。
此外,作为开发者,我们需要熟悉和掌握AI相关的技术栈,如向量数据库,API等,这些都是实现AI功能的关键。我认为目前我们对AI的应用还处于初级阶段,很多场景下人类的指导和提示(prompt)仍然很重要,就像搜索引擎的关键词,我们需要指导AI去理解和执行什么任务。虽然现在的AI如ChatGPT在进行复杂推理和长时间记忆方面还存在问题,但我期待未来AI技术的发展,比如ChatGPT的后续版本可能会具备更强的推理能力,它的记忆限制可能通过一些技术手段如向量数据库来得到改善。而当AI技术不断进步的时候,我们也必须警惕AI带来的潜在威胁,一些科技大佬如Elon Musk和George Hinton都提醒过我们,未来的超级智能AI可能对人类构成威胁,因此,我们需要对AI的开发和应用进行适当的立法监管。AI是一个强大的工具和助手,我们需要在善用它的同时,保持警惕和负责任的态度,为AI的发展和应用设定合理的边界。AI将继续发展并带来更多可能性,这需要我们既要有所准备,也要积极参与和影响。
白强:
我觉得这是一个极好的创业机会。许多人可能会想,GPT已经出来了,我可以基于GPT做些什么?这是一个很直接的问题,但更大的机会可能隐藏在背后。当AI开始取代文案工作、助理工作以及大量白领工作,我们应该思考,这将产生哪些新的工作?需要什么样的新服务?我认为这可能是下一轮创业潮的真正焦点。这还是一个蓝海市场,如果有人能从这里出发,可能有更大的希望。在94年,我还在攻读博士的时候,曾经做过一些网站,其中包括华夏文摘和金庸小说网。但有一天,我的一个朋友发现有一个加州的网站带走了很多流量,我们调查后发现,这个网站只是把当时火爆的网站分类,然后列在他的网站上,什么都没有做,就是列出了我们的网站。我们当时还嘲笑他们一番,结果这个网站就是Yahoo。
我曾有幸和杨致远讨论过这个问题,他认为这是一件非常简单的事情,就像当电话号码多了,你需要电话号码本,网站多了,你就需要网站号码本。同样的,现在AI解放了生产力,我们也需要思考,这将带来什么样的新需求?比如说,我们是否需要更多的人从事不能被AI和机器人代替的职业,比如踢球?
当整个行业都发生改变时,我认为创意工作将受到非常大的冲击。我曾和电影工作者合作过,我知道他们中的许多人其实并不那么聪明,但我们还是需要他们,因为我们需要他们的灵感。但现在,我们有了GPT,我们不需要他们了,我们可以让GPT生成很多创意,如果不满意,可以让GPT再生成更多的创意。
我想说的最后一点是,我们可以想象一下未来,大家都不需要工作,只需要领取Sam发的钱,然后消费。但是,如果有一天,AI变得非常厉害,他突然想到,我可以给AI发钱,AI给AI发钱,那人类还需要吗?按照比尔·盖茨的说法,我也相信,未来所有的行业,所有的公司,所有的部门,所有的人都会有虚拟助理,也就是模型。但是,有些人可能太懒或太笨,无法操作模型,最后可能会把模型委托给第三方公司操作。我认为,这些改变可能在未来五年左右发生,这是我对未来的预测。
于佳宁:
从我的视角来看,人工智能的发展对于人类社会来说,无疑是一件好事。它为我们提供了前所未有的便利,使我们有机会更加高效地生活和工作。然而,这并不意味着我们应该过度焦虑,担心被AI替代。我相信,人类的生活在总体上是朝着更好的方向发展的。无论我们是选择紧抓科技的风口,实现阶级跃升,还是选择稍微放松,享受科技带来的红利,都不应过于担心被淘汰。
未来,我觉得工作可能会变得更加以兴趣为导向。随着社会的发展,我们的工作方式可能会更加个性化,我们可以有更多的时间和机会去追求我们的爱好。这一点,也许有些类似于共产主义的理想,那就是每个人都可以按照自己的需求去分配资源,做自己真正喜欢的事情。
当然,AI的发展并不意味着人的创新性会被替代。虽然AI在创意工作上的发展迅速,但人的独特性,如情感、情绪等,仍然是AI无法完全复制的。即使现在有了声音合成技术,但我仍然觉得,真实的人的声音和情感是难以被AI完全替代的。
虽然我们可以享受到AI带来的便利,但我认为我们不能完全依赖AI,不能什么事都不做。我们需要带着感情去做事情,去追求我们的兴趣和爱好。对于未来,我有两种想法:一种是,人们可以有更多的时间去研究星辰大海等宏大的课题;另一种是,大多数人可能会用更多的时间去打游戏、看短视频等。我认为这两种观点都有一定的道理,也都存在一定的问题。但无论如何,我都坚信,只要我们愿意,我们都可以在AI的时代找到属于自己的位置。
现场提问:中美之间在AI领域的差距能否有效弥合?
黄连金:
在我看来,人工智能的发展需要依赖三个核心元素:数据、模型和算力。数据方面,我觉得中国有着无法比拟的优势,毕竟我们拥有庞大的互联网用户群体,这为我们提供了大量丰富多样的数据。模型方面,当前的主流是基于Transformer和自动回归的算法,如 self attention 和 market attention,我对这些领域的技术进展保持着密切关注。然而,我们也面临的一个重大挑战,那就是算力。虽然市面上可以购买到GPU,但价格昂贵,且中国在这方面还显得有些落后。我知道比特大陆曾尝试在GPU设计方面做出突破,但未能成功。我也留意到了一个叫做Cerebras的创业公司,他们试图通过设计大型芯片,以便更轻松地访问内存,提高处理速度。
对于未来的趋势,杨立昆认为Transformer在五年后将不再使用,我对此感到很惊讶,因为预训练模型似乎成为了未来的趋势。此外,Meta最近发布的一项研究也吸引了我的注意,他们提出了一种基于分层单词视图进行训练的新方法。这与Jeff Hinden的想法相吻合,他提出将算法与硬件相结合。我也注意到了Transformer模型存在的问题,即可能会产生无意义的输出,甚至可以称之为一本正经的胡说八道。然而,我也看到了这种模型的优点,如其创新能力和涌现能力。对于中国如何赶上这个领域,我认为我们可能需要自己设计GPU,甚至可能将Transformer架构直接应用到硬件设计上,这可能会为我们带来更大的优势。然而,这同时也需要大量的投入,这是我们当前面临的挑战。
现场提问:关于AI的数据的安全性,大语言模型最终是否会完全变成一个国家队的游戏?
黄连金:
在我看来,中国在数据法规、网络安全和个人隐私法方面的发展显著,并且已经在某些方面领先于美国和欧洲的GDPR。但在数据归属的问题上,中国的立法仍然模糊,特别是关于个人数据的归属。由于每个企业都有其专有的数据和隐私数据,我们未来可能看到的是每个企业都有多个大型AI模型,而不仅仅是一个。
在涉及到面向消费者的大型AI模型时,我们不能简单地将个人隐私数据添加到大型模型中,这是一个不能忽视的问题。如果大型AI模型是公司内部使用,而非公开面向消费者,那么这种模型国有化的可能性不大。但如果模型与国家安全或国防有关,或者模型属于国有企业,那么这种模型有可能归国家所有。但是,这并不会影响到我们普通公民的日常生活。
于佳宁:
我稍微补充一点,尽管国家拥有大量的数据,其数据处理能力通常无法与私人企业相比。政府的数据使用和资源整合都面临着巨大的挑战,这使得对这些数据进行有效的分析和利用变得更为困难。我曾在体制内工作,对他们的情况相对了解。政府的数据,尽管有一些积累,但在使用和资源整合上非常困难,更不用说有效分析利用了。曾有一段时间在疫情期间,政府开发了健康码之类的应用,但后来也不再进行,发现自己实际上没有能力维护和发展。
一旦出现隐私问题,政府所面临的影响往往比私人企业更大。从目前的情况来看,私人企业已经开始从各个角度考虑这个问题。一方面,大语言模型涉及到言论问题,这在中文世界可能是一个较大的问题。另一方面,确实存在隐私问题,例如在问答过程中可能会有很多隐私信息泄露。现在很多城市的财政状况都比较困难,他们正在考虑如何通过数据财政解决问题。如果能基于某些技术,打通数据交易,搞出平台,那么各个地方政府可能会愿意组织数据交易,盘活一些数据,获取一些收益。因此,构建基于大模型的数据交易体系,实现政府和私人部门的互利互惠,这可能是一个好的方向。
但我认为让这些大模型收归国有是困难的。尽管我不否认有可能出现基于国家安全或国防需要的大模型,但我并不认为这会普遍发生。总的来说,大模型的产生和发展将会是一个复杂的过程,涉及到多方面的因素和考量。
以上就是本次Twitter Space的精彩内容,希望大家能够从中获得一些有用的信息和启示。
支持媒体:
星球日报,Foresight News,链得得,博链财经
支持社区:
UWEB、Financing Force,Dev3,1783 DAO
欢迎关注GPTDAO的推特,获取最新活动消息。
中文推特:@GPTDAOCN
英文推特:@GPTDAOGLOBAL
评论(0)
Oh! no
您是否确认要删除该条评论吗?