熙运传承金融院专刊 |《AIGC发展趋势报告2023》-熙运财富

公号文章

熙运传承金融院专刊 \|《AIGC发展趋势报告2023》
发表时间：2023-06-15 阅读次数：
人工智能的未来，是人们所能想象到的最伟大的事情。——斯蒂芬·霍金文章来源：腾讯研究院——《AIGC发展趋势报告2023》「编者按」 2023年，被称作ChatGPT元年，ChatGPT的问世，让AIGC这把火彻底点燃了全世界。对于一个新兴事物而言，要达成月活用户量突破1亿这个成绩，智能手机用了16年，互联网用了7年，Twitter、Facebook等应用也用了4-5年的时间，而ChatGPT于2022年11月30日推出，5天后用户破百万，两个月后月活用户便突破1亿，成为史上用户增长速度最快的消费级应用程序。随后，各大互联网科技公司纷纷发布AIGC相关模型或应用，风投及产业资本疯狂涌入AIGC，从AI文本到AI图像、音频、视频，AIGC正以日新月异的方式颠覆着我们的认知。本期「熙运传承金融院专刊」，精选报告重点内容，从多个角度带您了解和解读AIGC的发展现状及未来趋势。关于腾讯研究院腾讯研究院，是腾讯公司设立的社会科学研究机构，旨在依托腾讯公司多元的产品、丰富的案例和海量的数据，围绕产业发展的焦点问题，通过开放合作的研究平台，汇集各界智慧，共同推动互联网产业健康、有序的发展。研究院下设法律研究中心、产业与经济研究中心、社会研究中心、犯罪研究中心、安全研究中心、专利与创新研究中心、“互联网+”创新中心，并设有博士后科研工作站。围绕互联网法律、公共政策、互联网经济、大数据等研究方向，与国内外研究机构、智库开展多元化的合作，不断推出面向互联网产业的数据和报告，为学术研究、产业发展和政策制定提供有力的研究支持。一 AIGC爆发的逻辑 ▲生成算法、预训练模型、多模态等 AI 技术累积融合，催生了AIGC 的大爆发一是，基础的生成算法模型不断突破创新；二是，预训练模型引发了 AIGC 技术能力的质变；三是，多模态技术推动了AIGC的内容多样性，让 AIGC 具有了更通用的能力。总的来看，AIGC 在 2022 年的爆发，主要是得益于深度学习模型方面的技术创新。不断创新的生成算法、预训练模型、多模态等技术融合带来了 AIGC 技术变革，拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的 AIGC 模型成为了自动化内容生产的“工厂”和“流水线”。 ▲AIGC产业生态加速形成和发展，走向模型即服务(Maas) 的未来目前，AIGC 产业生态体系的雏形已现，呈现为上中下三层架构。第一层，为上游基础层，也就是由预训练模型为基础搭建的 AIGC 技术基础设施层。目前在AIGC领域，美国的基础设施型公司(处于上游生态位)有OpenAl、Stability.ai等OpenAl 的商业模式为对受控的 api 调用进行收费。Stability.ai 以基础版完全开源为主，然后通过开发和销售专业版和定制版实现商业获利，目前估值已经超过 10 亿美金。因为有了基础层的技术支撑，下游行业才能如雨后春笋般发展，形成了目前美国的 AIGC 商业流。第二层，为中间层，即垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施，在此基础上可以快速抽取生成场景化、定制化、个性化的小模型，实现在不同行业、垂直领域、功能场景的工业流水线式部署，同时兼具按需使用、高效经济的优势。第三层，为应用层，即面向 C 端用户的文字、图片、音视频等内容生成服务。在应用层，侧重满足用户的需求，将 AIGC 模型和用户的需求无缝街接起来实现产业落地。随着数字技术与实体经济融合程度不断加深，以及互联网平台的数字化场景向元宇宙转型，人类对数字内容总量和丰富程度的整体需求不断提高。AIGC 作为当前新型的内容生产方式，已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展市场潜力逐渐显现。与此同时，在推进数实融合、加快产业升级的进程中，金融、医疗、工业等各行各业的AIGC应用也都在快速发展。二消费端: AIGC牵引数字内容领域的全新变革 ▲AIGC有望塑造数字内容生产与交互新范式，成为未来互联网的内容生产基础设施当前，数字内容迈入强需求、视频化、拼创意的螺旋式升级周期，AIGC恰恰在这一发展阶段迎合了这一需要。从全球来看，人们在线的时间持续增长，在线新闻、音乐、动漫、影视、文学、游戏的市场规模仍在上升。同时，数字内容消费的结构也正转型升级，从以图文为主过度到视频为主视频在网络流量中的占比不断上升。从范围上看，AIGC 逐步深度融入到文字、音乐、图片、视频、3D 多种媒介形态的生产中。从效果上看，AIGC在基于自然语言的文本、语音和图片生成领域初步令人满意，在视频和3D等某个复杂度高的领域处于探索阶段，但成长很快。从方式上看，AIGC 的多模态加工是热点。典型应用包括如文本转换语音、文本生成图片，广义来看，AI翻译、图片风格化也可以看作是两个不同“模态”间的映射。在 AIGC 图像生成火爆的同时，ChatGPT 横空出世，真正做到和人类“对答如流能理解各式各样的需求，做出回答、短文和诗歌创作、代码写作、数学和逻辑计算等。ChatGPT 可以看作 GPT3.5 版本，使用了人类反馈强化学习(RLHF) 技术，能持续学习人类对回答的建议和评价，朝更加正确的方向前进。 ▲AIGC的应用生态和内容消费市场逐渐繁荣 AIGC 作为当前新型的内容生产方式，凭借着自动内容生成、提高内容质量、增加内容多样性、降低成本门槛以及个性化定制等优势，已经率先在传媒、电商、影视、娱乐等数字化程度高内容需求丰富的行业取得重大创新发展，市场潜力逐渐显现。2022 年，AIGC 发展速度惊人迭代速度呈现指数级爆发，谷歌、Meta、百度等平台型巨头持续布局，也有 Stability Al、Jasper Al 等独角兽创业公司出世。AI绘画已经能承担图像内容生成的辅助性工作，前期初稿的形成可以由 Al 提供，后期再由创作者进行调整，从而提高内容产出效率。根据 6pen 预测，未来五年，10%-30% 的图片内容由 AI 参与生成，有望创造超过 600亿以上的市场空间，若考虑到下一代互联网对内容需求的迅速提升，国外商业咨询机构 Acumen Research and Consultino预测，2030 年 AIGC 市场规模将达到 1100 亿美元。 ▲AIGC将日益成为未来3D互联网的基础支撑互联网向下一代技术升级和演进的重要方向是从“在线”走向“在场”，迈向 3D 互联网时代，AIGC 将成为打造虚实集成世界的基石。人们将在虚拟空间构建仿真世界，在现实世界“叠加”虚拟增强，实现真正的临场感。随着 XR、游戏引擎、云游戏等各种交互、仿真、传输技术的突破，信息传输越来越接近无损，数字仿真能力真假难辨，人类的交互和体验将到达新阶段。 AIGC 为 3D 互联网带来的价值，既包括 3D 模型、场景、角色制作能效的提升，也能像 AI作画那样，为创作者激发新的灵感。传统的 3D 制作需要耗费大量时间和人力成本。以 2018 年发售的游戏《荒野大镖客2》为例，为了打造约 60 平方公里的虚拟场景、先后有六百余名美术人员历经8年才得以完成。尽管目前 AIGC 在 3D 模型领域还处于探索阶段，从基本原理和使用的模型来看，仍然以扩散模型为基础，但随着英伟达等多家科技公司在该方向的深耕细作，AIGC在3D建模领域必将大有可为。 ▲聊天机器人和数字人成为新的、更包容性的用户交互界面，不断拓展应用领域聊天机器人: 2022年12月1日，美国人工智能研究公司 OpenAl 研发的AI聊天机器人产品 ChatGPT 正式对外开放，一经推出便火遍全网，截至12月12日已拥有超过 100 万名用户。而 ChatGPT 正是典型的文本生成式 AIGC。数字人: 数字人、虚拟机器人是数字智能体(digital agent)，作为新的交互形式，目前已有很多应用，包括元宇宙应用中的NPC虚拟角色、用户虚拟替身/虚拟形象(avatar)，主要分为真人驱动和 AI 驱动两种。 ▲AIGC将作为生产力工具来推动元宇宙发展首先，AIGC为构建沉浸式的元宇宙空间环境提供了核心基础设施技术，将成为元宇宙的生产力工具。其次，AIGC将作为生产力工具为元宇宙用户提供个性化内容体验。最后，AIGC 也将作为用户交互界面的一部分在元宇宙中发挥作用。三产业端: 合成数据牵引人工智能的未来随着 AIGC 技术持续创新发展，基于 AIGC 算法模型创建、生成合成数据(synthetic data)迎来重大进展，有望解决 Al发展应用过程中的数据限制，进一步推动 AI技术更广泛的应用。因此，业界非常看好合成数据的发展前景及其对人工智能未来发展的巨大价值。数据是人工智能的燃料和驱动力，合成数据将极大拓展人工智能发展应用的数据基础，可以认为，合成数据关乎人工智能的未来。 ▲合成数据为AI模型训练开发提供强大助推器，推动实现AI2.0 可以说，目前人工智能仍处在1.0阶段，数据方面的限制在很大程度上阻碍了人工智能更广泛的应用和部署。合成数据有望解决这些问题，推动人工智能迈向 2.0 阶段，可以在更大程度上拓展人工智能的应用。具体而言，对于人工智能而言，合成数据可以发挥诸多价值： 1.实现数据增强和数据模拟，解决数据匮乏、数据质量等问题，包括通过合成数据来改善基准测试数据(benchmark data) 的质量等: 2.避免数据隐私/安全/保密问题，利用合成数据训练 AI模型可以避免用户隐私问题，这对于金融、医疗等领域而言尤其具有意义: 3.确保数据多样性更多反映真实世界，提升AI的公平性，以及纠正历史数据中的偏见，消除算法歧视。 4.应对长尾、边缘案例，提高Al的准确性、可靠性，因为通过合成数据可以自动创建、生成现实世界中难以或者无法采集的数据场景，更好确保AI模型的准确性: 5.提升AI模型训练速度和效果。总之，利用合成数据可以更廉价、更高效、更准确、更安全可靠地训练 AI 模型，进而极大扩展 Al 的应用可能性，将人工智能推向新的发展阶段。 ▲合成数据助力破解Al“深水区”的数据难题，持续拓展产业互联网应用空间。合成数据早期主要应用于计算机视觉领域，因为计算机视觉被广泛应用于自动驾驶汽车、机器人、安防、制造业等领域，在这些应用场景中打造AI模型都需要大量的被标注的图像、视频数据。生成性AI受欢迎的原因是能够通过合成数据以成本更低、易规模化、隐私保护合规的方式提供接近真实世界的数据。 ▲合成数据产业加快成为数据要素市场新赛道，科技大厂和创新企业抢先布局合成数据对人工智能未来发展的巨大价值使其加速成为 AI 领域的一个新产业赛道。一方面，国外的主流科技公司纷纷瞄准合成数据领域加大投入与布局。另一方面，合成数据作为AI领域的新型产业，相关创新创业方兴未艾，合成数据创业公司不断涌现，合成数据领域的投资并购持续升温，开始涌现了合成数据即服务这一发展前景十分广阔的全新商业模式。 ▲合成数据加速构建AI赋能、数实融合的大型虚拟世界合成数据指向的终极应用形态是借助游戏引擎、3D 图形、AIGC 技术构建的数实融合的大型虚拟世界。大型虚拟世界对于人工智能的核心价值在于，为测试、开发新的人工智能应用，提供了一个安全、可靠、高效以及最重要的是一一低成本的、可重复利用的环境。展望未来，可以从三个方面来理解大型虚拟世界为什么成为 AI 数实融合的关键场景。第一，大型虚拟世界可以提供人工智能开发所需的数据和场景，为 AI 应用开发提供“加速度”。第二，大型虚拟世界为各行各业训练开发AI提供了试验田。第三，在大型虚拟世界中通过AI连通虚拟与现实，实现AI数实融合。总之，大型虚拟世界对于支持人工智能研究开发、促进数实融合的巨大可能性，值得持续深挖和不断探索。四社会端: AIGC助力可持续社会价值 “生成”显然是2022年的主线。历经数年蛰伏与积累之后，在这一年，AIGC得到快速发展并迅速成为科技圈与创投圈的热词，也在应用领域收获数百万量级的用户。那么，来势凶猛的AIGC会创造何种社会价值，对人类又有什么意义? AIGC 的社会价值体现为革新数字内容与艺术创造领域，并将辐射到其他领域和行业，孕育新的技术形态与价值模式，甚至会成为通往AGI的可能性路径: 1.AIGC以高效率、低成本满足个性化需求，完成基础性工作，释放人类创造力，推动艺术创造领域与基础概念革新; 2.AIGC的生成能力将延伸、辐射深入到其他领域(如医疗、教育、传媒、影视、工业，以及元宇宙、数字人领域)，通过进一步互动结合，催化新的业态与价值模式，形成“AIGC+”效应； 3.经由应用层积累的巨量数据，推动大模型提升计算复杂度，AIGC将成为通向通用人工智能(Artificial general intelligence ) 的可能性路径。五 AIGC带来的社会伦理问题伴随 AIGC 这一最新浪潮，以及对产业、社会带来的可以预见的未来变革，过去信息技术的共性问题又有新的呈现，同时也有新的问题产生。此前，DeepMind对预训练模型的风险做了分析和概括，共分为六个具体的风险领域: 1.歧视、仇恨言论和排斥；2.真实信息危害；3.错误信息危害；4.恶意使用；5.人机交互危害；6. 环境和社会经济危害。六展望: 拥抱人工智能的下一个时代，打造可信AIGC生态 2022年见证了AIGC的快速崛起和破圈发展。但对于AIGC领域而言，这仅仅是一个开始，更大的变革尚待开启。在过去的深度学习黄金十年，人工智能的感知、理解能力不断增强，为AIGC的爆发奠定基础。如今，随着生成算法、大模型、多模态技术等技术的持续创新和发展成熟，AI领域正在经历从感知、理解到生成、创造的跃迁。以AIGC这一新的疆域为标志，Al领域正在迎来下一个时代。融合大模型和多模态技术的AIGC模型，有望成为新的技术平台深度赋能各行各业。未来，“AIGC+”将在经济社会的各个领域持续大放异彩。从基础性的AIGC模型，到中间层的垂直化、定制化、个性化的模型工具，再到下游层出不穷的、各种各样的 AIGC 产品和服务，AIGC 的产业生态正在加速形成和发展。AIGC 将创造出巨大的经济社会价值，其应用不限于互联网领域，也将给文化、娱乐、教育、金融、医疗、公共服务、交通、制造等诸多领域带来积极影响。经历了 2022 年的喧嚣和炒作，2023 年AIGC将乘势而起，迎来更大发展。面向人工智能的下一个时代，人们需要更加负责任地、以人为本地发展应用AIGC技术，打造可信的AIGC生态。面对AIGC 技术应用可能带来的知识产权保护、信息内容安全、算法歧视和社会伦理等问题，社会各界需要协同参与、共同应对，通过法律、伦理、技术等方面的多元措施支持构建可信Al生态。在立法方面，网信办等三部门出台的《互联网信息服务深度合成管理规定》针对深度合成技术服务提出的要求和管理措施，诸如禁止性要求、标识要求、安全评估等，亦适用于AIGC。下一步，需要着重从以下方面持续推进AIGC的政策和治理。其一，政府部门需要结合 AIGC技术的发展应用情况，制定并明晰AIGC的知识产权与数据权益保护规则。目前，AIGC的知识产权与数据权益保护规则的不明确，在某种程度上导致甚至加剧了Al领域的乱象。其二，研发应用AIGC技术的主体需要积极探索自律管理措施，例如，秉持不作恶、科技向善等目的，制定适宜的政策(消极要求和积极要求)，采取控制和安全措施保障AIGC的安全可控应用，采取内容识别、内容溯源等技术确保AIGC的可靠来源。其三，打造安全可信的AIGC应用，需要深入推进 AI伦理治理。例如，行业组织可以制定可信AIGC的伦理指南，更好支持AIGC领域的健康可持续发展；AIGC领域的创新主体需要考虑通过伦理委员会等方式，推进落实AI风险管理、伦理审查评估等，确保在AIGC应用中实现“伦理嵌入设计”。其四，产业政策需要支持、促进AIGC在产业互联网领域的深入应用，挖掘合成数据作为AI数实融合基础载体的巨大价值，持续壮大我国发展人工智能的数据要素优势。此外社会各界需要携手应对AIGC领域的能源消耗问题，致力于打造绿色可持续、环境友好型的AI模型，实现智能化与低碳化融合发展。「结语」伴随着热议与争议，AIGC正在以日新月异的趋势飞速发展和进化。从2017年夏天柯洁大战AlphaGo开始，到2022年的《太空歌剧院》，再到ChatGPT的爆火，这一波席卷人类的科技革命已成定势，人工智能必将深刻的改变这个世界。大势所趋，莫之能挡，唯顺势而为、借势而进、造势而起、乘势而上!未来已来，让我们拥抱 AIGC，拥抱人工智能的下一个时代，打造更美好的未来。免责声明：本文是为提供一般信息的用途编制，并非广告、要约邀请、投资建议或基金产品说明书，并非旨在成为投资、财务、法律或其它专业意见。请向您的顾问获取具体意见。

上一篇：熙运香港艺术视角 \| 法国五月艺术节
下一篇：熙运资产双周刊 06/20—07/05