生成式人工智能(Artificial Inteligence Generated Content)是人工智能领域的重要分支,,一种基于算法和模型生成文本、图片、声音、视频、代码等内容的技术,不同于传统A!的分析功能,生成式A1能学习并生成具有逻辎的新内容。不同于传统的人工智能仅对输入数据进行处理和分析,生成式人工智能可以学习并模拟事物的内在规律,根据用户的输入资料生成具有逻辖性和连贯性的新内容。这一技术的核心依托于多模态模型,能针对用户需求实现异构数据的生成式输出。
生成模型的基础理论最早在20世纪50年代至80年代确立,这一时期主要集中于概率模型等生成理论算法的研究。1950年代的马尔可夫链(Markov Chains)和1970年代的隐马尔可夫模型(Hidden Markov Models, HMM)为生成式模型奠定了理论基础。
随着计算能力的提升和海量数据的应用,生成式AI进入了以大语言模型(LLMs)为主的阶段。2018年,OpenAl发布了GPT(Generative Pre-trained Transformer)模型,通过大规模数据的预训练和自回归生成能力,推动了自然语言生成的显著进展。
2022年底,ChatGPT正式上线并迅速普及:标志着生成式AI进入大规模商业化应用阶段。ChatGPT基于GPT-3.5,能进行自然流畅的对话,广泛应用于教育、客户服务等领域。ChatGPT的成功激励了其他科技公司加快生成式AI应用的开发。
2014年,lan Goodfellow等人提出了生成对抗网络(GAN),标志着生成式人工智能的关键突破。GAN通过生成器和判别器的对抗训练,能够生成高度真实的图像和数据,是现代生成式AI的重要模型之一。
2020年,OpenAl发布了GPT-3,具备1750亿参数,是当时规模最大的语言模型。GPT-3具备强大的自然语言理解和生成能力,广泛应用于对话、写作等任务。同年,OpenAl发布了DALL-E,展示了生成式AI在图像生成领域的多模态能力。
伴随生成式AI的广泛应用,各国开始制定政策和行业标准,确保生成式AI技术的安全合规。2024年,联合国科技大会上发布了生成式AI的应用安全测试标准,中国工信部和网信办等也相继出台了生成式AI服务的管理办法,规范行业发展。