关于ChatGPT,聊点不一样的

关于ChatGPT,聊点不一样的

1.关于 ChatGPT 有哪些基础知识点?

ChatGPT 其实是一个“生成型预训练聊天机器人”,具备语言理解和文本生成能力。它使用 Transformer 神经网络架构,是一种通过人类反馈强化学习进行内容生成和交互的技术集合。训练数据来自包括维基百科,以及真实对话在内的庞大语料库。与分析式人工智能不同,生成式人工智能的目标是学习数据产生的模式并创造新样本。

  1. “生成型”:ChatGPT 引入了关系变量和内在关联性,处理内在要素和与人、场景的关系。其按照资料本身的逻辑关系进行重新梳理和整合,生成有结构的文本。
  2. “预训练”:ChatGPT 通过底层智能技术——深度学习,它使用大量未标记的数据对模型进行训练,以便使模型具备某种形式的“先验知识”,然后再通过少量的标记数据进行微调。
  3. “聊天型机器人”:ChatGPT 运用 RLHF 技术(基于人类反馈的强化学习),让人工智能模型产生尽可能匹配人类常识、认知、需求和价值观的文本。

ChatGPT 的诞生,不是一蹴而就的,它经历了 GPT-1、GPT-2、GPT-3、InstructGPT模型的持续演化升级。

  • GPT-1 通过预训练进行无监督训练和有监督微调
  • GPT-2 在 GPT-1 的基础上进行了多项改进,实现了执行任务的多样性,并开始学习在不需要明确监督的情况下执行数量惊人的任务;
  • GPT-3 对 GPT-2 追求无监督与零次学习的特征进行了改进,模型参数增加了 110 多倍
  • InstructGPT 使用人类反馈强化学习训练范式,并对大型语言模型进行微调,从而在减少参数的情况下实现了优于 GPT-3 的功能。
  • 在InstructGPT 基础上,ChatGPT 增加了对话属性。
模型 发布时间 参数量 预训练数据量
GPT-1 2018年6月 1.17亿 约5GB
GPT-2 2019年2月 15亿 40G
GPT-3 2020年5月 1750亿 45TB
InstructGPT 2022年3月 1750亿 /
ChatGPT 2022年11月 预计千亿级 预计百T级
GPT-4 2023年3月 网传100万亿(大概率是假的)网传5000亿(也有概率是假的)可能只是比GPT-3大一些,1750-2800亿之间 /

2.ChatGPT 中短期的发展趋势?

ChatGPT在中短期内主要应用于归纳性文字工作代码开发图像生成智能客服等领域。

现在,有一些观点夸大了 ChatGPT 的能力,似乎它可以替代人的大部分认知和理解性的工作,其实这是一种误解。

  1. 可能出错:ChatGPT 依托于神经网络模型和互联网现有的语料进行训练,但这些训练数据本身质量参差不齐,可能出现事实性错误问题。
  2. 胡说八道:ChatGPT 的答案仅基于其理解生成的最佳结果,可能存在“一本正经地胡说八道”的情况。
  3. 不懂常识:理解自然语言的难点之一在于语境问题,缺少上下文可能导致 ChatGPT 对语义的误解。

因此,ChatGPT 目前只能替代一些归纳型的工作,而不是创造型的工作类型。比如,在撰写论文的文献综述方面,ChatGPT 可能表现不俗,但要写出一种新的学术观点,还不太行。


3.ChatGPT 对人是一种赋能?

互联网将各种信息和知识以一种平等的方式均衡地连接到每一个人身上,但人和人在使用这些信息资源方面的能力有很大差异,有些人可以凭借着这些丰富的信息资源创新创造,而也有相当多的人面对屏幕只能获得直接浅薄的感官消遣。

互联网的信息获取大概经历了三个阶段:

  1. 第一阶段:精英们的信息霸权。

技术精英通过基于浏览器的网站技术打破了传播局限于某个专业领域的垄断性霸权,使更多的社会精英能够通过网站来传播信息,而不需要经过传统媒体的采集、加工和把关。

  1. 第二阶段:每个人都可以是传播者。

社交平台和短视频技术的普及打破了话语表达的精英霸权,降低了内容生产和社会表达的门槛,使得每个人都可以成为传播者。

  1. 第三阶段:达到优秀的平均线。

ChatGPT 突破了不同人群在资源使用和整合方面的能力差异,使得每个人都可以在理论上使用社会平均线以上的语义表达和资源动员能力进行社交内容生产和对话。

可见,ChatGPT 为首的生成型工具,是对人的新一次赋能。


4.ChatGPT 对信息传播的影响?

ChatGPT 对信息的传播产生了四大影响:

  1. 首先,它使传播权力更加下沉,让普罗大众在内容创新、传播表达和对话中拥有更多平等机会,符合“分布式社会”的权力构造。
  2. 其次,它推动传播领域核心逻辑的进一步“算法化”,人们将更信赖精准、全面、可靠的智能算法。算法信任成为更高维度社会重构的价值基础,有望演变为构建数字文明时代社会的“操作系统”。
  3. 第三,传媒业由传统密集型产业转向技术密集型和资本密集型产业。ChatGPT 的影响下,未充分运用人工智能技术的传媒从业者可能被边缘化。此外,头部技术的迭代升级需要巨大的资本支持。
  4. 最后,主流媒介的角色转移。在 ChatGPT 浪潮下,主流媒介将转向 ToB 模式,成为内容生产者背后的价值逻辑和专业规则的建构者、支持者,创新创造的开拓者及话语场域的平衡者。

5.ChatGPT 对人类职业的影响?

职业是现代社会的一种现实和观念,人的职业活动是人类获得生活意义和幸福感的重要途径,同时,职场是人类发挥社会影响力的关键场所。

ChatGPT 的出现引起了人类的职业恐慌,是因为人们担心,耗费 10-20 年的时间和大量经济、社会资源形成的职业技能在一夜之间会被 ChatGPT 代替。其实,这是一种高估 ChatGPT 的,不必要的担忧。

ChatGPT 被归为弱人工智能的一种,它能够进行内容生成,但不满足通用人工智能的标准。ChatGPT 的专长是稳定关系模式的工作。它擅长那些人类做起来费事的、模式化的、可迭代的工作。例如数据输入和记录保存、简单的财务分析和报告、基本的客户服务、重复性体力劳动、电话营销和电话销售等。

而人类擅长的是复杂的创造性工作,ChatGPT 不是要替代人类的职业,而是提高人类职业效率,特别是提高人类职业质量

目前,ChatGPT 还不具备人类的驾驭情绪、适应变化和坚守价值观等特有能力,因此只能取代人类职业的部分工作,尽管未来强人工智能的出现有很大可能性替代人类的部分职业,但也会为人类带来新的职业。

总之,大道至简:

  1. 驾驭情绪、坚持学习和实践,是人类适应职业变化的唯一途径。
  2. AI 不会淘汰人,但是会淘汰那些不会用 AI 的人。

6.ChatGPT 的机遇与挑战?

ChatGPT 带来的机遇

  1. 时间方面:可以抢占先机,有弯道超车的机会。目前,由于政策和技术的影响,许多互联网企业都处于起步试水的布局阶段。如果能把握现在的机会,就可以在竞争中占据时间优势。

  2. 技术应用方面:可以重塑新的商业模式。ChatGPT 可以与互联网企业的业务结合得非常紧密,在搜索引擎、传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的领域中,可以获得重大突破的机会。

  3. 新业务开拓方面:可以形成多业态发展的机会。由于国家大力支持人工智能、类 ChatGPT 技术应用,资本市场也对人工智能持续青睐,对 ChatGPT 也持看好态度。如果能抓住当前重要时机,就可以向多业态发展的方向前进。

ChatGPT 带来的挑战

  1. 首先,在数据和云服务等方面,维护和开发的压力不断增加,对业务的开展带来了极大的挑战。ChatGPT 或类 ChatGPT 都需要大量的语料数据来训练模型,并需要大量的算力来支持其训练和部署。到 2026 年,可能就没有更多高质量的数据可以训练人工智能了。此外,ChatGPT 在应用时需要大算力的服务器支持,而这些服务器的成本是普通用户无法承受的。即便数以亿计的参数模型也需要惊人数量的计算资源才能运行和训练。如果面向真实的数以亿计的用户请求,企业难以承受这一巨大的成本。对于短视频平台等应用来说,还需要更高的数据、算法和算力要求。

  2. 其次,在安全方面,ChatGPT 也面临着内容安全、技术滥用、用户隐私安全、身份安全和技术本身安全等挑战。随着 ChatGPT 内容的不断增长,虚假信息和信息安全等内容方面的挑战会增加,例如,ChatGPT 会生成看似正确的错误答案。对 ChatGPT 的滥用,可能引发深度合成诈骗、色情、诽谤、假冒身份等新型违法犯罪行为。ChatGPT 训练的数据基本来源于互联网,其中可能包括个人隐私数据,并且预训练模型强大的推理能力可能会导致个人隐私泄漏的风险。ChatGPT 的恶意使用也引发人们对个人身份盗用、冒用等数字身份安全的担忧。此外,技术本身遭受黑客攻击、数据中毒等方面的风险也需要引起重视。对于嵌入 ChatGPT 式的企业来说,网络安全、数据出境、出口管制等方面的潜在风险更大,一旦受中美经贸摩擦影响,企业被停止使用 ChatGPT 将造成极大的被动,影响长期发展。

  3. 最后,在伦理和知识产权方面:以 ChatGPT 为代表的智能生成产品的创作过程具有不可解释性,因此其输出结果存在极大的不确定性和不稳定性,如何确保其合乎道德的利用面临巨大挑战,目前科技伦理治理手段难以落地。在知识产权方面,ChatGPT 生成的内容基于互联网庞大的语料,容易引发著作权侵权问题。同时,关于用户输入指令生成的创作内容是否能够享有著作权仍然存在较大争议。此外,用户自主创作的内容和引导机器创作的内容交织不清,增加了著作权溯源的难度。


7.一些专家的看法?

  • 目前,ChatGPT 是人为设置的,它的结果经过了反复地迭代,其实能输出所有可能的组合。它根据使用者的文化习惯,提供关联性最高的内容。人由于生理上的限制,不可能在短时间内生成大量的结果,但是 ChatGPT 能做到。所以,ChatGPT 所能做到的,更像是一种制造,其制造所用的原材料是我们的文字,是我们的语言。对于人文层面的人来讲,知识的生成之外我们更在意有启发性的思想,但它不是靠现有内容排列组合的,而是很多时候,靠一种经历、一种感悟,这也是人比机器更强大的地方,即在于理性的表达。——熊红凯

  • 有三类能力是 ChatGPT 暂时不具有且需要人类自己掌握的。首先,在于人的互动中驾驭情绪的能力。其次,在不断变化的世界里适应变化的能力。最后,在技术不断触及人类伦理边界时,坚守人类价值观和设定人类伦理边界的能力。——邱泽奇

  • ChatGPT 的诞生,让人类和机器之间的体力代替关系,进入到了部分的智力代替关系阶段。——葛红兵

  • ChatGPT 也是一个只能洗稿器,它很少直接复制,而是采取同义词替换、语序改变等多种方式。——王迁

  • ChatGPT 无法就未知的不合理的行为有所创生。他能够清晰地表达已有的知识,但不能进行不合理的表达。——周志强

  • ChatGPT 具有强大的回答问题的能力,和强大的解决问题的能力。但是它缺乏跳出自身、提出问题的能力。创造新的知识的能力,正式人类智能的门槛。——顾小清

本文转载自 《Vol.44 | 关于ChatGPT,聊点不一样的_思维周刊_第 44 期》

什么是数据库事务特性和隔离级别… 数据存储中5种最常见的索引模型
Comments are closed.