> **来源:[研报客](https://pc.yanbaoke.cn)** DeepSeek 每个人都可以读懂的大模型科普报告(实战篇) # DeepSeek等大模型工具使用手册 林子雨 副教授 厦门大学 厦门大学大数据教学团队作品2025年5月2日 # 厦门大学大数据教学团队 林子雨 夏小云 赖永炫 蔡炳跃 陶继平 苏淑文 赵江声 谢怡 郑海山 张琦 郑宇辉 杨帆 # 国内高校大数据教学的重要贡献者 团队负责人:林子雨 副教授 年轻力量:核心成员全部46周岁以下 结构合理:教学型、科研型、实验工程师 专注专业:从2013年至今,11年专注于大数据教学 团队特点:眼光前瞻、紧跟技术、创新实干、执行力强 影响力高:多项指标在国内高校大数据教学领域领先 教材数量 教材占有率 MOOC课程学习人数 师资培养 教学研讨会 教学网站访问量 - 在线讲座观看人数 . 团队联系方式:ziyulin@xmu.edu.cn # 大模型系列报告(科普报告,非技术报告) 全网浏览量远超1000万,成为众多大型国企和政府部门内部培训资料 ■ 报告1:大模型概念、技术与应用实践(面向社会大众) ■ 报告2: DeepSeek大模型赋能高校教学和科研 (面向高校) ■ 报告3:DeepSeek大模型及其企业应用实践(面向企业) ■ 报告4: DeepSeek大模型赋能政府数字化转型 (面向政府部门) ■ 报告5:DeepSeek等大模型工具使用手册(面向所有人) # 大模型系列报告(科普报告,非技术报告) 应邀为天津大学、浙江工商大学、自然资源部海洋三所、福建省农业农村厅、福建省市场监督管理局、福建省广电网络、厦门翔业集团、龙岩龙净环保、厦门市国安局、厦门市海关等做50余场科普讲座,引起热烈反响 这个老师好会讲 本来很抽象的东西 不会听的睡觉 嗯啊,很厉害,听的比较有意思 林教授,您好!我是白俄罗斯国立大学孔子学院的对外汉语老师强,同时也是白俄罗斯国际广播电台的兼职中文主播,今天在YouTube中看到了您的讲座---DeepSeek大模型赋能高校教学和科研,非常受启迪,很感谢您,也希望未来有机会您可以给我们孔院的老师做一个关于人工智能赋能汉语教学的讲座。 太感谢了林教授!今天的学习让我们大开眼界、受益匪浅! 谢谢老师,真幸运能遇到您听您讲课。 收到, 谢谢林老师, 讲得特别精彩! 深入浅出, 受益匪浅 我是上海交通职业技术学院智能网联汽车带头人 。仔细回放观看了您的课,课程很实用,资源丰富。 星期二17:34 多谢肯定哈 星期二18:19 课程思政,水到渠成 # 本报告所有用到的图片、文字、视频等素材下载地址 下载地址:https://dblab.xmu.edu.cn/post/deepseek/ (1)报告1: 大模型概念、技术与应用实践 (140页PPT读懂大模型, 面向社会大众) (已经于2025年2月9日发布) (2)报告2: DeepSeek大模型赋能高校教学和科研 (120页PPT, 面向高校) (已经于2025年2月25日发布) (3)报告3: DeepSeek大模型及其企业应用实践 (150页PPT,面向企业) (已经于2025年3月3日发布) (4)报告4: DeepSeek大模型赋能政府数字化转型 (122页PPT,面向政府部门) (已经于2025年3月9日发布) (5) 报告5: DeepSeek等大模型工具使用手册 (171页, 面向所有人) (已经于2025年5月2日发布) 【所有报告PPT、视频和素材下载地址】请点击这里从百度网盘下载报告PPT和视频。提取码是ziyu 进入下载网页后,在上面画红框这个位置下载所有素材 # 目录 01 AIGC概述 02 文本类AIGC应用实践 03 图片类AIGC应用实践 04 语音类AIGC应用实践 05 视频类AIGC应用实践 06 AIGC技术在辅助编程中的应用 07 AI搜索 # 01 # Part one # AIGC概述 # 1.1 什么是AIGC # 概念与核心技术 AIGC的全称为“Artificial Intelligence Generated Content”,中文翻译为“人工智能生成内容”。这是一种新的创作方式,利用人工智能技术来生成各种形式的内容,包括文字、音乐、图像、视频等。AIGC是人工智能进入全新发展时期的重要标志,其核心技术包括生成对抗网络(GAN, Generative Adversarial Networks)、大型预训练模型、多模态技术等。 # 核心思想 AIGC的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习,AIGC可以根据输入的条件或指导,生成与之相关的内容。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、图像、音频、视频等。 # 应用 AIGC技术不仅可以提高内容生产的效率和质量,还可以为创作者提供更多的灵感和支持。在文学创作、艺术设计、游戏开发、影视制作等领域,AIGC可以自动创作出高质量的文本、图像、音频、视频等内容。同时,AIGC也可以应用于媒体、教育、娱乐、营销、科研等领域,为用户提供高质量、高效率、高个性化的内容服务。 # 1.2 AIGC与大模型的关系 大模型与AIGC之间的关系可以说是相辅相成、相互促进的。大模型为AIGC提供了强大的技术基础和支撑,而AIGC则进一步推动了大模型的发展和应用 01 大模型为AIGC提供了丰富的数据资源和强大的计算能力 02 AIGC的需求也推动了大模型的发展 03 大模型和AIGC的结合,也带来了广泛的应用前景 现在的AIGC基本上都是使用了DeepSeek、豆包、Kimi、即梦AI等大模型工具 # 1.3 AIGC的发展历程 # AIGC的发展历程可以分成三个阶段:早期萌芽阶段、沉淀累积阶段和快速发展阶段,具体如下: # 早期萌芽阶段(上世纪50年代至90年代中期) 由于技术限制,AIGC仅限于小范围实验和应用,例如,1957年出现了首支电脑创作的音乐作品《依利亚克组曲》。然而,在上世纪80年代末至90年代中期,由于高成本和难以商业化,AIGC的资本投入有限,因此,未能取得许多显著进展。 # 沉淀累积阶段(上世纪90年代至本世纪10年代中期) AIGC逐渐从实验性转向实用性,2006年深度学习算法取得进展,同时,GPU和CPU等算力设备日益精进,互联网快速发展,为各类人工智能算法提供了海量数据进行训练。2007年出版了首部由AIGC创作的小说《在路上》,2012年微软展示了全自动同声传译系统,主要基于深度神经网络(Deep Neural Networks,DNN),自动将英文讲话内容通过语音识别等技术生成中文。 # 快速发展阶段(本世纪10年代中期至今) 2014年深度学习算法“生成式对抗网络”(Generative Adversarial Network, GAN)推出并迭代更新,助力AIGC实现新发展。2017年微软人工智能少年“小冰”推出世界首部由人工智能写作的诗集《阳光失了玻璃窗》,2018年NVIDIA(英伟达)发布StyleGAN模型可自动生成图片,2019年DeepMind发布DVD-GAN模型可生成连续视频。2021年OpenAI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、图像的交互生成内容。2024年2月16日,OpenAI再次震撼全球科技界,发布了名为Sora的文本生成视频大模型,只需输入文本就能自动生成视频。2024年5月14日,OpenAI公司推出一款名为GPT-4o的大模型,具备“听、看、说”的出色本领。目前,AIGC基本上都采用了大模型技术。 AIGC可以应用于各行各业,主要包括但不限于生成文字、图像、音频、视频等,具体如下: # 电商 生成商品标题、描述、广告文案和广告图 # 办公 写周报日报,写方案,写运营活动,制作PPT,写读后感,写代码 # 游戏 生成场景原画,生成角色形象,生成世界观,生成数值,生成3D模型,生成NPC对话,音效生成 # 娱乐 头像生成,照片修复,图像生成,音乐生成 # 影视 生成分镜头脚本,生成剧本脚本,台词润色,生成推广宣传物料,音乐生成 # 1.4 常见的AIGC应用场景 # 动漫 原画绘制,动画生成,分镜生成,音乐生成 # 艺术 写诗,写小说,生成艺术创作品,草图生成,艺术风格转换,音乐创作 # 教育 批改试卷,试卷创建,搜题答题,课程设计,课程总结,虚拟讲师 # 设计 UI设计,美术设计,插画设计,建筑设计 # 媒体 软文撰写,大纲提炼,热点撰写 # 生活 制定学习计划,做旅游规划 # 1.6 AIGC技术对职业发展的影响 # AIGC技术对职业发展产生了深远的影响,主要体现在以下几个方面: # 新兴职业的出现 随着AIGC技术的快速发展,一系列与该技术相关的新兴职业应运而生。例如,AI训练师、机器学习工程师、数据标注员等职业需求激增。这些新兴职业不仅要求从业者具备扎实的技术基础,还需要不断学习和掌握最新的AIGC技术动态。 # 传统职业的转型升级 AIGC技术也为传统职业的转型升级提供了契机。许多传统职业如编辑、设计师、教师等,在AIGC技术的辅助下,工作效率和创作质量得到了显著提升。同时,这些职业也需要从业者不断适应技术变革,掌握新的技能和工具,以适应市场需求的变化。 # 工作方式的变革 AIGC技术改变了传统的工作方式,使得远程工作、灵活办公成为可能。许多企业开始采用AIGC技术来优化工作流程,减少人力成本,提高工作效率。这种变革不仅为员工提供了更加灵活的工作方式,也为企业带来了更大的经济效益。 # 职业发展路径的多样化 AIGC技术的发展为职业发展路径提供了更多的可能性。从业者可以根据自己的兴趣和特长,选择适合自己的职业发展方向。例如,一些对AI技术感兴趣的从业者可以选择成为AI训练师或机器学习工程师,而一些具有创意和设计才能的从业者则可以利用AIGC技术来提升自己的创作能力。 # 持续学习与技能提升 面对AIGC技术的快速发展,从业者需要不断学习和提升自己的技能水平。通过参加培训课程、阅读专业书籍、参与技术论坛等方式,从业者可以紧跟技术前沿,保持自己的竞争力。 # 1.7 常见的AIGC大模型工具 常见的AIGC大模型工具包括: OpenAI的ChatGPT DeepSeek 科大讯飞的讯飞星火 阿里的通义千问 百度的文心一言 字节跳动豆包 Kimi 这些工具基于大规模语言模型技术,具备文本生成、语言理解、知识问答、逻辑推理等多种能力,可广泛应用于写作辅助、内容创作、智能客服等多个领域。通过不断迭代和优化,为用户提供更加智能、高效的内容生成解决方案 # 1.8 AIGC大模型的提示词 AIGC大模型的提示词(Prompt)是指用户向大模型输入的文本内容,用于触发大模型的响应并指导其如何生成或回应 这些提示词可以是一个问题、一段描述、一个指令,甚至是一个带有详细参数的文字描述。它们为大模型提供了生成对应文本、图片、音频、视频等内容的基础信息和指导方向。 提示词的重要作用如下: 引导生成 增强交互性 提高准确性 # 1.8 AIGC大模型的提示词 使用提示词需要注意一些技巧,这样可以从大模型获得更加符合我们预期要求的结果,主要技巧如下: 简洁明确 考虑受众 分解复杂任务 使用肯定性指令 示例驱动 明确角色 遵守规则 自然语言回答 # 02 Part two # 文本类AIGC应用实践 本节所有内容有对应的教学视频(林子雨主讲) 观看地址:https://dblab.xmu.edu.cn/post/ai/ 进入这个网页,下拉,找到“MOOC视频”栏目 # 2. 文本类AIGC应用实践 文本类AIGC利用先进的机器学习和深度学习算法,通过对大量文本数据的分析和学习,自动产生具有创意和质量的文本内容。这些内容包括但不限于新闻报道、广告文案、社交媒体帖子、教材资料、小说故事等。文本类AIGC能够模仿人类写作风格,实现高效、多样、持续的内容创作,为内容生产领域带来了革命性的变化 # 2.1 文本类AIGC应用场景 # 文本类AIGC已经在多个领域得到了广泛应用,主要包括: # 新闻报道 人工智能写作技术能够快速生成新闻报道,尤其是在突发事件中,能够迅速整合信息并生成初步报道,为传统新闻机构提供有力支持。 # 广告文案 广告商利用AI技术快速生成针对不同受众群体的个性化文案,以提高广告效果。AI写作程序能够分析用户数据,生成符合用户兴趣和需求的广告内容。 # 社交媒体内容创作 企业和个人利用AI写作程序快速创建高质量的社交媒体内容,以提升品牌影响力和用户粘性。 # 文学创作 AI在文学创作领域也展现出一定潜力。通过深度学习算法,AI可以学习并分析大量文学作品,生成具有一定文学价值的文本内容。虽然目前AI创作的文学作品还难以完全替代人类创作,但其独特的创作风格和视角为文学创作带来了新的可能性。 # 其他行业 智能文本生成还广泛应用于电子商务、人机交互、电子政务、智慧教育、智慧医疗、智慧司法等多个行业和领域。例如,在电子商务中,AI可以生成产品描述、促销信息等;在智慧医疗中,AI可以辅助医生撰写病历、诊断报告等。 # 2.2 案例1:与DeepSeek进行对话 # 1.快速体验DeepSeek 访问DeepSeek官网(https://chat.deepseek.com/),会出现如图所示对话界面,在提示词输入框的底部,有两个按钮,即“深度思考(R1)”和“联网搜索”,可以用鼠标点击来选中或取消,默认情况下,“深度思考(R1)”按钮是处于选中状态,“联网搜索”则处于未选中状态。两个按钮的功能如下: (1) 深度思考(R1)。表示触发更复杂的多步推理能力,适合需要逻辑链分析的场景,典型使用场景包括数学题/物理题推导、文学作品的隐喻分析、编程问题的架构设计、需要分步骤解释的操作指南等。 (2) 联网搜索。表示实时获取最新网络信息,适合时效性强的查询,典型使用场景包括查询实时股价/汇率、验证最新科研成果、获取突发事件进展、检索特定网页内容等。 我是 DeepSeek, 很高兴见到你! 我可以帮你写代码、读文件、写作各种创意内容,请把你的任务交给我吧~ 给DeepSeek发送消息 深度思考 (R1) 联网搜索 # 2.2 案例1:与DeepSeek进行对话 # 1.快速体验DeepSeek 在提示词输入框中输入“请模仿李白的《望庐山瀑布》做一首诗,题目是《看厦门鼓浪屿》”,然后回车,或者用鼠标点击提示词输入框右侧的箭头按钮,向DeepSeek发起提问。DeepSeek给出的回答如图所示,需要注意的是,大模型属于概率模型,每次生成的回答内容可能不完全相同。 已深度思考(用时21秒) 《看厦门鼓浪屿》 鹭岛东南烟水遥,日光岩上碧云飘。 琴潮忽卷干堆雪,散作凤凰霞万条。 注:本诗仿太白雄奇飘逸之风,首句以“烟水遥”勾勒海上仙山意境,承以日光岩实景作天地支点。转句化琴岛声波为视觉浪涌,取“干堆雪”暗合东坡赤壁豪情,结句凤凰木朱华迸天,将声、光、色熔铸为漫天红霞,较之银河落九天另开海上生霞之瑰丽新境。 # 2.2 案例1:与DeepSeek进行对话 # 2.DeepSeek的基本用法 作为初学者,DeepSeek的一些“魔法”指令也很有用,比如,你可以输入“/步骤如何用手机拍摄旅游照片”,DeepSeek返回的回答结果就会按照步骤详细给出拍摄旅游照片的说明,再比如,你可以输入“请解释量子计算,然后/简化”,它就会返回比较简明扼要的回答。 表 DeepSeek的“魔法”指令 <table><tr><td>指令</td><td>功能</td></tr><tr><td>/续写</td><td>当回答中断时自动继续生成</td></tr><tr><td>/简化</td><td>将复杂内容转换成大白话</td></tr><tr><td>/示例</td><td>要求展示实际案例(特别是写代码时)</td></tr><tr><td>/步骤</td><td>让AI分步骤指导操作流程</td></tr><tr><td>/检查</td><td>帮你发现文档中的错误</td></tr></table> # 2.3案例2:与百度文心一言进行对话 # (2) 告诉文心一言你要的结构 在构建提示词时,应明确指定期望的输出结构。比如,如果是要求生成一篇文章,可以在提示词中明确指出“请按照引言-正文-结论的结构来撰写”。这样,文心一言在生成内容时,会遵循这一结构框架,使得输出更加条理清晰、逻辑严密。再比如,如果要撰写给上级领导的方案、报告、总结时,可以使用提示词: 请按照【现状/问题/解决方案,数据洞察/问题概览/调研方向,数据/亮点/问题/经验】这个结构撰写一份关于我国芯片行业的总结报告 # 2.3案例2:与百度文心一言进行对话 # (4) 告诉文心一言你的内容要求 可以通过详细具体的提示词明确表达内容要求。无论是希望生成的文章主题、关键词汇,还是期望涵盖的信息点情感倾向,都应在提示词中清晰呈现。这样做能让文心一言更准确地理解用户需求,生成更符合期望的内容。比如,可以通过如下提示词表达自己的内容要求: 在6G专利申请方面,中国已经遥遥领先。2021年的数据显示,中国的6G专利申请量占比高达 $40.3\%$ ,稳坐世界第一的宝座。 请把上面的数据更新到目前最新的数据 # 2.3案例2:与百度文心一言进行对话 # (4) 告诉文心一言你的内容要求 如果对输出的内容有比较多的要求或限制,不妨在输入框中将这些内容要求一条一条明确告诉文心一言,比如,可以采用类似如下的提示词: 请以小红书的风格,按照以下要求帮我为“海景美食餐厅”写一篇小红书种草文案;内容要求: (1) 要有标题、正文 (2) 标题字数:不超过 20 个字;尽量简短精炼,要足够吸引眼球,用词浮夸 (3) 正文分段,层次分明,每段最少100字 (4) 要用 “首先、其次、最后” 这种模式 (5) 整篇文案不要超过 1000 个字 # 2.3案例2:与百度文心一言进行对话 # (5) 告诉文心一言你想写的文体 明确指定文体,如散文、小说、诗歌、科技文等,让大模型理解并模拟该文体的语言特点、结构安排和表达习惯,从而输出更具针对性的文本。比如,可以采用提示词“请写一段[中秋赏月]的朋友圈文案,需要采用藏头诗的形式” # 文心大模型3.5 请写一段[中秋赏月]的朋友圈文案,需要采用藏头诗的形式 中秋佳节月如盘, 秋意渐浓夜未寒。 赏景怡情心自远, 月华如水洒人间。 愿君安康福满园, 家家团圆笑语喧。 幸福安康常相伴, 美满生活共婵娟。 由文心大模型3.5生成 # 2.3案例2:与百度文心一言进行对话 # (6) 指导文心一言分步解决问题 将复杂问题拆解成多个简单、具体的步骤,作为提示词输入给文心一言。这样不仅能降低问题的处理难度,使文心一言更容易理解和响应,还能确保解决问题的过程更加系统、有条理。通过逐步引导,可以逐步逼近问题的解决方案,提高答案的准确性和实用性。 比如,如果想让文心一言帮你制定一份旅行规划,可以使用类似如下的提示词: 请为我规划一次为期一周的厦门自由行; (1) 第1步:列出必去的景点,如厦门大学、鼓浪屿、环岛路、五缘湾、曾厝垵; (2) 第2步:根据景点位置安排每日行程,确保交通便利; (3) 第3步:推荐几家当地的特色餐厅,包括早餐、午餐和晚餐; (4) 第4步:提供一家性价比高的酒店住宿建议,并考虑其位置是否便于游览。 # 2.3案例2:与百度文心一言进行对话 # (7) 告诉文心一言你要的示例 明确沟通意图,通过具体示例引导大模型理解你的需求。这有助于文心一言更准确地捕捉你的思维框架和期望结果,减少误解。比如,可以使用类似如下的提示词: 我是一位高校教师,请帮我写一份工作周报,内容尽量简洁精炼,下面是我本周的工作内容: (1) 完成了5个本科生毕业论文修改 (2) 撰写了教材的一个章节 “云计算与大数据” 输出要求示例: 【本周工作周报】 【本周工作进展】本周做了哪些事,产生了哪些结果 【下周工作安排】基于本周的结果下周要推进哪些事 【思考总结】简要说说本周的收获和反思 # 2.3案例2:与百度文心一言进行对话 # (8) 告诉文心一言你要的场景 在输入提示词时,应明确描述所需的上下文或环境背景,如“在科幻电影中描述一个未来城市的景象”或“请撰写一封给朋友的生日祝福信,场景设定在海边日落时”。这样做有助于文心一言更好地理解你的需求,生成更符合场景氛围和情境的内容,从而提升输出内容的贴切性和情感共鸣。 请撰写一封给朋友的生日祝福信,场景设定在海边日落时 亲爱的[朋友的名字] 在这温柔的海边,当夕阳如同熔金般缓缓沉入波光粼粼的海平线,我静静地坐在被晚霞染红的沙滩上,心中涌动着无限的思绪与温暖,只想借着这绝美的景致,将我最真挚的祝福编织成文字,穿越海风,轻轻送达你的心田。 今天,是你的生日,一个特别而又平凡的日子,特别在于它是专属于你的庆典,平凡则是因为在这浩瀚宇宙中,每一天都有生命在庆祝新的开始。但我想,对于你而言,这一天定然意义非凡,因为它见证了你又一年的成长,又一年的风华绝代。 海浪轻拍着岸边,似乎在低语着岁月的故事,每一次潮起潮落,都是时间轻轻的脚步。我站在这里,仿 # 2.4案例3:使用讯飞智文生成PPT 讯飞智文是科大讯飞公司旗下的AI一键生成PPT/WORD的网站平台,是基于科大讯飞星火认知大模型技术基础上开发的一个具体应用,主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、模板图示切换功能。这里介绍如何使用讯飞智文快速生成PPT。 请首先准备一个包含文本内容的PDF文件,比如,可以从网络新闻报道中复制一段关于2024年7月19日微软蓝屏事件的内容保存到一个WORD文档中,命名为“微软蓝屏.docx”,然后,使用WPS软件打开“微软蓝屏.docx”,把该WORD文档保存成PDF格式,生成“微软蓝屏.pdf”。 # 2.4案例3:使用讯飞智文生成PPT 访问讯飞智文官网(https://zhiwen.xfyun.cn/),在首页(如图2-1所示)中点击“免费使用”,然后按照网页提示完成注册(推荐使用手机号注册)。 # 智能文档AI助理 一键生成Word、PPT文档,让工作和学习更轻松、更高效 免费使用 图2- 1 讯飞智文页面 # 2.4案例3:使用讯飞智文生成PPT 在页面中(如图2-2所示)点击“开始制作”。在出现的页面中(如图2-3所示),选择AI PPT的“文档创建”。然后,在出现的页面中(如图2-4所示),点击“点击上传”,把本地文件“微软蓝屏.pdf”文件上传上去(当然,也可以上传“微软蓝屏.docx”)。 然后,在出现的页面中(如图2-5所示),点击“开始解析文档”。之后,页面会显示提示文字“好的,已收到您的要求,让我先为您生成PPT标题和大纲”。过一会儿,就会显示自动生成的PPT标题和大纲,如果你不满意,可以点击页面底部的“重新生成”,如果满意,可以直接点击“下一步”。 图2-2 开始创作 # 2.4案例3:使用讯飞智文生成PPT 快速开始 X AI PPT 图2-3 选择AI PPT中的“文档创建” 主题创建 文本创建 文档创建 自定义创建 AI Word Word创建 AI读写 读写创建 # PPT创作-文档创建中 上传文档,AI提取文档中的关键信息,生成一个贴合文档材料内容及要求的PPT文档 您好,我是您的专属PPT AI助手,请先上传你的文档,AI助手会对文档内容进行解析。 图2-4 上传文件 将文件拖到此处或点击上传 上传文件支持pdf(不支持扫描件)、doc、docx、txt、md格式的文档,文件大小不能超过10MB 文档生成语言: 中文(简体) 演讲备注 AI配图 开始解析文档 微软蓝屏.pdf 将文件拖到此处或点击此处重新上传 上传文件支持pdf(不支持扫描件)、doc、docx、txt、md格式的文档,文件大小不能超过10MB 文档生成语言: 中文(简体) 图2-5 开始解析文档 演讲备注 AI配图 开始解析文档 # 2.4案例3:使用讯飞智文生成PPT 在出现的页面中(如图2-6所示),选择你想要的模板配色,比如,这里选择“清逸天蓝”,然后点击页面顶部的“下一步”。经过一段时间以后,页面就会显示自动生成的PPT,点击页面右上角的“导出”,就可以把PPT保存到本地电脑中,然后,可以根据自己的需求,自己对PPT继续进行修改和完善。在本地电脑中打开自动生成的PPT,可以看出,AI制作PPT的水平非常专业,逻辑清晰,配图精美,超过了很多PPT初级者的制作水平,可以大大提高普通用户制作PPT的效率和水平。 图2-6 选择模板配色 # 2.5案例4:使用DeepSeek+Kimi制作PPT # 生成PPT框架 借助DeepSeek生成PPT框架,包括主题、目录、各页简要内容等,明确PPT的结构和核心要点。 # 制作PPT 使用Kimi根据生成的框架制作PPT,包括选择合适的模板、风格、配色等,并进行必要的编辑和美化,最终生成高质量的演示文稿。 # 2.5案例4:使用DeepSeek+Kimi制作PPT # 使用DeepSeek生成PPT大纲 登录DeepSeek平台,输入PPT提示词,生成并保存PPT大纲和框架。提示词应明确主题、结构和目标受众,可指定页数和内容要求,输入要求的语气和格式,以便生成符合需求的PPT框架。 # 使用Kimi生成PPT 登录Kimi平台,输入制作PPT的需求(复制 DeepSeek生成的PPT大纲和框架),一键生成 PPT并选择合适的模板和风格。对生成的PPT进行 个性化编辑和调整,确认无误后下载保存。 # 2.5案例4:使用DeepSeek+Kimi制作PPT 0 # 步骤1: 登录DeepSeek平台。在浏览器地址栏中输入 "https://www_deepseek.com/"网址,进入“DeepSeek”平台,完成登录后,进入平台的对话功能界面。 04 05 02 # 步骤2: 输入你要生成PPT的提示词 06 03 # 步骤3: 生成并保存DeepSeek生成的PPT大纲和框架 # 步骤4: 登录KIMI平台。在浏览器地址栏中输入“https://kimi.moonshot.cn/”网址,进入“KIMI平台”,登录成功后,点击平台左侧的“kimi+”后选择PPT助手功能 # 步骤5: 复制DeepSeek生成的PPT大纲和框架 # 步骤6: 一键生成PPT并选择适合的PPT模板和风格 0> # 步骤7: 编辑和确认生成的PPT内容,无误后下载PPT # 2.5案例4:使用DeepSeek+Kimi制作PPT (1) 访问DeepSeek(www_deepseek.com)或者通过百度入口 (www.baidu.com)进入 DeepSeek。在DeepSeek的对话框中输入提示词“请你帮我只做一份简短的关于大模型的科普报告PPT”,提交 (2) 把在DeepSeek生成的内容复制到“剪切板”中,可以点击底部的复制图表按钮(如下图所示) 请你帮我只做一份简短的关于大模型的科普报告PPT DeepSeek-V3最新版 回答完成 已为您生成可自由编辑的大纲。确认无误后,点击下方「选择模板」按钮,即可进入PPT模板选择页面。 主标题:大模型技术科普报告 第1章:大模型概述 1.1 定义与基本概念 1.2发展历程与里程碑 1.3典型代表(如GPT、BERT等) 第2章:大模型的核心技术 2.1 深度学习基础 2.2 Transformer架构 2.3 预训练与微调机制 第4章:大模型的挑战与争议 4.1 算力与能源消耗 4.2 数据隐私与伦理问题 4.3 模型偏见与可控性 第5章:未来发展趋势 5.1 模型轻量化方向 5.2行业垂直化应用 5.3 人工智能法规与治理 降为子节 $④$ 新增章节删除 选择模板 # 2.5案例4:使用DeepSeek+Kimi制作PPT (3) 访问Kimi官网 (www.kimi.com), 在页面左侧点击 “Kimi+”, 然后, 在右侧页面点击“PPT助手” # 官方推荐 (4) 把DeepSeek生成的内容粘贴到对话框中(可以使用键盘组合键 $\mathrm{Ctrl} + \mathrm{V}$ ),然后,点击 Kimi对话框右下角的提交按钮(向上的箭头) PPT无处不在,Kimi+为你分忧,帮你制作详尽且有说服力的PPT文稿,转达信息,说服听众 以中国传统文化艺术的魅力"为主题,生成一份PPT 我是个游戏行业从业者,帮生成一份王者荣耀VS英雄联盟的PPT 帮我制作一份竞选学生会主席的PPT # 大模型技术科普报告 1.大模型概述 1.1定义与基本概念 1.2发展历程与里程碑 1.3典型代表(如GPT、BERT等) # (5) Kimi正在根据PPT框架生成具体的PPT文字内容 搜索大模型发展历程里程碑 # 大模型技术科普报告 # 1.大模型概述 # 1.1定义与基本概念 # 1.1.1大模型的定义 - 大模型是具有超大规模参数和数据的深度学习模型,参数量可达千亿级,数据量达TB甚至PB级别 - 其核心是利用海量数据训练出通用模型,再针对特定任务微调,兼具强大学习能力和泛化能力。 # 1.2发展历程与里程碑 # 1.2.1 早期探索与奠基 - 20世纪50年代,人工智能概念萌芽,专家系统等早期方法受限于规则和数据。 2006年深度学习兴起,为大模型发展奠定基础 随时@你想要的Kimi+使用各种能力 (6) Kimi完成文字内容的生成以后,可以点击页面底部的“一键生成PPT”按钮 5.3 人工智能法规与治理 5.3.1法规制定与监管 - 随着大模型应用普及,相关法规和治理框架将不断完善,以规范模型开发和使用。 - 法规将关注数据隐私保护、模型偏见纠正、伦理审查等方面,确保技术健康发展。 复制 C重试 分享 一键生成PPT > Transformer架构如何提升模型性能? 大模型在计算机视觉中具体有哪些应用? 如何减轻大模型训练过程中的能源消耗? 随时@你想要的Kimi+使用各种能力 $\oplus$ 已联网 (7) 选择PPT模板,单后,点击页面右上角的“生成PPT”按钮,开始生成PPT (8) PPT生成以后,可以点击页面右下角的“下载”按钮,把原始格式PPT下载到本地电脑。 # 2.5案例5:使用DeepSeek+xmind制作思维导图 # 案例:DeepSeek+xmind制作思维导图 将我们准备好的电子书上传到DeepSeek,并输入提示词:现在我需要做一个xmind思维导图,请帮这份文档输出为Markdown格式 将内容复制到text的文件中,进行保存,并将文件的后缀名改为.md 打开xmind软件,通过文件-导入-Markdown进行文件的导入,最后就能马上渲染出一个非常完美的思维脑图 # markdown # 高效能人士的七个习惯 # 作者简介 **史蒂芬·柯维** 《时代周刊》"美国25个最具影响力人物"之一 - 《经济学人》“最具前瞻性管理思想家” -核心理念:由内而外的自我重塑 # ## 核心框架 mermaid graph TD A[七个习惯]-->B[个人成功] A $\rightarrow$ C[公共成功] A $\rightarrow \rightarrow$ D[自我更新] B-->B1[习惯1-3] C-->C1[习惯4-6] D-->D1【习惯7】 # 03 Part three # 图片类AIGC应用实践 本节所有内容有对应的教学视频(林子雨主讲) 观看地址:https://dblab.xmu.edu.cn/post/ai/ 进入这个网页,下拉,找到“MOOC视频”栏目 # 3.图片类AIGC应用实践 # 图片类AIGC应用场景 # 案例1:创意图片生成 # 案例2: AI修图与老照片修复 # 案例3:图片扩展与高清化 # 案例4: 智能抠图与图片融合 # 案例5:涂抹消除与局部重绘 # 案例6: AI绘画艺术创作 # 案例7:真实照片转成二次元风格 # 图像生成 # 图像修复 # 图像增强 # 图像识别 # 3.2 案例1:创意图片生成 这里使用AIGC工具即梦AI,根据给定的主题或描述生成具有创意和艺术感的图片,并探索不同提示词对生成结果的影响。 步骤1:打开一站式AI创作平台即梦AI。在浏览器中打开网址 https://jimeng.jianying.com/ai-tool/home,注册并登录后,进入如图所示的页面,该平台是一款面向所有用户,满足日常需求的国内领先的AIGC综合平台。 # 3.2 案例1:创意图片生成 步骤2:进入创作界面。点击页面上方AI作图栏里的“图片生成”按钮,进入创作界面,如图所示,创作部分主要分为图片生成和视频生成。接下来将对“图片生成”的具体操作进行介绍。 # 3.2 案例1:创意图片生成 步骤3:确定主题与提示词。首先选择一个主题,例如“梦幻森林中的精灵聚会”。然后,编写不同详细程度的提示词,比如,可以使用提示词“一片充满神秘气息的梦幻森林,树木高大且闪烁着奇异光芒,精灵们身着华丽服饰在森林空地上举办热闹聚会,有魔法元素环绕”,或者也可以使用比较简单的提示词“梦幻森林,精灵聚会”。 步骤4:生成图片操作。在左侧的提示词文本框中描述想要生成的图片,首先输入简略提示词“梦幻森林,精灵聚会”,设置生图模型为“图片2.0 Pro”,精细度为“5”,图片比例为“16:9”,图片尺寸为“1024*576”,如图所示。 # 3.2 案例1:创意图片生成 然后点击“立即生成”按钮,稍等片刻后,在页面右方的图片生成区就可以看到新生成的4张图,如图所示。 接下来,更换为较为详细的提示词:“一片充满神秘气息的梦幻森林,树木高大且闪烁着奇异光芒,精灵们身着华丽服饰在森林空地上举办热闹聚会,有魔法元素环绕”,重复上述生成步骤,其他参数保持一致,可以看到生成了4张新图,如图所示。 # 3.2 案例1:创意图片生成 # 更换为更加详细的提示词,具体如下: 在一片弥漫着古老魔法与无尽神秘气息的梦幻森林深处,高耸入云的树木仿佛直插天际,它们的树干上缠绕着散发着柔和蓝光的藤蔓,树叶则在微风中轻轻摇曳,闪烁着翠绿与银白交织的奇异光芒。月光透过稀疏的树冠,洒下斑驳陆离的光影,为这片森林增添了几分幽静与奇幻。 森林的中心地带,一块被精心清理过的空地上,正举办着一场热闹非凡的精灵聚会。精灵们身着用自然界最绚烂色彩编织而成的华丽服饰,有的裙摆轻拂过地面,如同绽放的花朵;有的则佩戴着由露珠和星辰碎片制成的饰品,在灯光下熠熠生辉。他们的笑声清脆悦耳,与远处小溪潺潺的水声交织成一首动人的乐章。 聚会中,各式各样的魔法元素无处不在。空中漂浮着几个小巧的魔法灯笼,它们自动排列成各种图案,为聚会提供柔和而神秘的光源。一些精灵手持魔法杖,轻轻一挥便能召唤出绚烂的烟花或是让周围的花朵瞬间绽放。更有精通音律的精灵,以魔法为弦,弹奏出能触动心灵深处的旋律,让整个森林都为之动容。 # 3.2 案例1:创意图片生成 重复上述生成步骤,其他参数保持一致,生成结果如图所示。 # 即梦-图片生成 12-05 21:30 在一片弥漫着古老魔法与无尽神秘气息的梦幻森林深处,高耸入云的树木仿佛直插天际,它们的树干上缠绕着散发着柔和蓝光的藤蔓,树叶则在微风中轻轻摇曳,闪烁着翠绿与银白交织的奇异光芒。月光透过稀疏的树冠,洒下斑驳陆离的光影,为这片森林增添了几分幽静与奇幻。 森林的中心地带,一块被精心清理过的空地上,正举办着一场热闹非凡的精灵聚会。精灵们身着用自然界最绚烂色彩编织而成的华丽服饰,有的裙摆轻拂过地面,如同绽放的花朵;有的则佩戴着由露珠和星辰碎片制成的饰品,在灯光下熠熠生辉。他们的笑声清脆悦耳,与远处小溪潺潺的水声交织成一首动人的乐章。 聚会中,各式各样的魔法元素无处不在。空中漂浮着几个小巧的魔法灯笼,它们自动排列成各种图案,为聚会提供柔和而神秘的光源。一些精灵手持魔法杖,轻轻一挥便能召唤出绚烂的烟花或是让周围的花朵瞬间绽放。更有精通音律的精灵,以魔法为弦,弹奏出能触动心灵深处的旋律,让整个森林都为之动容。 # 3.2 案例1:创意图片生成 步骤5:结果分析与对比。观察并对比几组提示词生成的图片。从画面丰富度、元素契合度、艺术感染力等方面进行评估。分析提示词的详细程度、描述准确性如何影响生成图片的质量和内容呈现。从三组提示词结果中分别选取一张较为满意的图片作为对比,如图所示。 # 3.3 案例2:AI修图与老照片修复 这里使用百度AI图片助手,对一张普通照片进行修图优化,并对一张有损坏的褪色的老照片进行修复,对比修图前后效果并分析不同修复策略。 步骤1:打开百度AI图片助手。在浏览器中打开网址https://image.baidu.com/,进入百度AI图片助手页面,如图所示。 # 3.3 案例2:AI修图与老照片修复 点击右上角的“登录”按钮,注册登录成功后,点击搜索框下方的AI创作工具区域,比如“变清晰”,即可进入百度AI图片助手页面,如图所示。 # 3.3 案例2:AI修图与老照片修复 步骤2:上传照片。点击中间的“上传图片”按钮,上传一张普通人物照片“普通人物照片.jpg”(可以从本报告官网下载),照片存在光线较暗、清晰度不够等问题,如图所示。 本报告所有素材可以从报告官网下载:https://dblab.xmu.edu.cn/post/deepseek/ # 3.3 案例2:AI修图与老照片修复 步骤3:普通照片修图操作。上传完毕后,AI图片助手默认使用“变清晰”功能,自动生成了效果图,如图所示。 # 3.3 案例2:AI修图与老照片修复 步骤4:保存图片。画质增强后,照片提高了亮度使人物面部更清晰,增加了色彩饱和度,使用细节增强算法突出了头发和眼睛等部位的细节。如果觉得效果满意,点击右下方的“下载”图标即可进行保存,修图效果如图所示。 # 3.3 案例2:AI修图与老照片修复 步骤5:打开魔搭社区的AI老照片修复。打开网址 "https://www.modelscope.cn/studios/iic/old.Photo.Restoration/"。进入如图所示页面。 # 3.3 案例2:AI修图与老照片修复 步骤6:上传老照片。点击中间的“登录”按钮进行注册登录,然后点击左侧的“点击上传”区域,开始上传图片,上传一张黑白老照片“黑白老照片.png”(可以从本报告官网下载),要对其进行修复上色,如图所示。 本报告所有素材可以从报告官网下载:https://dblab.xmu.edu.cn/post/deepseek/ # 3.3 案例2:AI修图与老照片修复 步骤6:老照片修复。上传图片后,分别选择左侧的“重新上色”、“应用图像去噪”和“应用色彩增强”为“是”,然后点击“一键修复”按钮,观察照片在色彩、去噪等方面的变化,如图所示。 # 3.3 案例2:AI修图与老照片修复 步骤7:保存图片。重新上色、去噪和色彩增强后,照片色彩更加生动,同时AI算法突出了面容、服饰等部位的细节。如果觉得效果满意,点击效果图右上角的“下载”图标即可进行保存,修复效果如图所示。 # 3.4 案例3:图片扩展与高清化 这里使用百度AI图片助手,对一张尺寸较小且分辨率较低的图片进行扩展放大并提升清晰度。 步骤1:打开百度AI图片助手。如之前实验操作一样,导入一张 $300 \times 200$ 像素的小尺寸山区风景图“低分辨率山区风景图.png”(可以从本报告官网下载),图片存在模糊和锯齿现象,如图所示。 本报告所有素材可以从报告官网下载:https://dblab.xmu.edu.cn/post/deepseek/ # 3.4 案例3:图片扩展与高清化 步骤2:图片扩展操作。上传完图片后,图片助手默认进行了一次“清晰化”操作,我们可以看到图片效果变清晰了,选择右侧的编辑方式为“AI扩图”,选择拓展比例为“1:1”,如图所示。 # 3.4 案例3:图片扩展与高清化 步骤3:保存图片。点击右下方的“立即生成”按钮,稍等片刻后,点击“下载”,得到一张 $1024 \times 1024$ 像素的AI扩展图,如图所示。 # 3.5 案例4:智能抠图与图片融合 这里使用即梦AI,对两张图片分别进行智能抠图,然后将抠出的主体进行创意叠加合成,探索不同叠加方式和抠图精度对合成效果的影响。 步骤1:打开即梦AI的智能画布页面。在浏览器中打开网址 https://jimeng.jianying.com/ai-tool/image-edit,进入如图所示的页面。 # 3.5 案例4:智能抠图与图片融合 步骤2:上传人物图片。点击左侧的“上传图片”按钮,上传需要去除背景的图片,笔者选择了一张小女孩骑单车的照片“小女孩骑单车.png”(可以从本报告官网下载),如图所示。 本报告所有素材可以从报告官网下载:https://dblab.xmu.edu.cn/post/deepseek/ # 3.5 案例4:智能抠图与图片融合 步骤3:抠图操作。照片导入后,点击照片上方的“抠图”按钮,智能画布将自动识别人像主体区域,然后,点击下方的“抠图”按钮,即可实现智能抠图,如图所示。 # 3.5 案例4:智能抠图与图片融合 步骤4:保存图片。可以观察工具自动识别并抠取人物主体的效果(如图所示),通过缩放图片来检查人物边缘是否存在毛边或误抠现象,比如,这里可以看到小女孩的头发并没有被完整抠取,可以选择图片上方功能区的“画笔”、“橡皮擦”等功能进行调整,如果对抠图效果满意,可以点击“完成编辑”按钮,再点击右上角的“导出”按钮保存图片。 # 3.5 案例4:智能抠图与图片融合 步骤5:上传风景图片。点击左侧的“上传照片”按钮,上传需要作为背景的图片,这里选择了一张日落沙滩的照片“日落沙滩.png”(可以从本报告官网下载),如图所示。 本报告所有素材可以从报告官网下载:https://dblab.xmu.edu.cn/post/deepseek/ # 3.5 案例4:智能抠图与图片融合 步骤6:调整图层。首先,选中“图层2”后,点击上方功能区的“画板适应内容”图标。然后,拖动右侧图层区域中的“图层1”到“图层2”之上,使人物在风景之上,通过缩放人物大小,使其和背景尽量比例协调,如图所示。 # 3.5 案例4:智能抠图与图片融合 步骤7:图片融合操作。点击图片上方功能区的“融图”按钮。此时,工具会提示分别选择需融合的“前景图层”和“背景图层”,这里选择人物图片作为前景,风景图片作为背景。也可以在下方的输入框写入提示词,描述想要的色调和光影,如图所示。 # 3.5 案例4:智能抠图与图片融合 然后,点击下方的“立即融图”按钮,等待图片生成,将智能生成四张融合后的效果图,选择一张比较满意的图片,点击“完成编辑”按钮,最后点击右上方的“导出”按钮,即可进行保存,融图效果如图所示。 # 3.5 案例4:智能抠图与图片融合 步骤8:结果分析与创意探索。不同的图片叠加算法和抠图精度对最终合成图片效果都会造成影响,AIGC平台可以智能地处理这些问题,可以尝试不同图片组合和叠加创意,例如将多个抠取的元素进行复杂的合成,进一步挖掘智能抠图与图片叠加在创意制作中的潜力。 # 3.6 案例5:涂抹消除与局部重绘 这里使用即梦AI,对一张有瑕疵和不需要元素的图片进行涂抹消除,并利用局部重绘功能对图片特定区域进行创意修改,观察不同涂抹参数和编辑策略对图片效果的影响。 步骤1:打开即梦AI智能画布。在浏览器中打开网址https://jimeng.jianying.com/aitool/image-edit/,如之前实验操作一样,导入一张有背景污渍、小动物和水印的产品图片“待处理的产品照片.png”(可以从本报告官网下载),如图所示。 # 3.6 案例5:涂抹消除与局部重绘 点击上方功能区的“画板适应内容”按钮,使产品图片铺满整个画布,如图所示。 # 3.6 案例5:涂抹消除与局部重绘 步骤2:涂抹消除操作。选择图片上方功能区的“消除笔”图标,设置涂抹画笔大小为“30”左右。在图片上对右下角的水印文字进行涂抹,然后,点击下方的蓝色按钮“消除”,如图所示。 # 3.6 案例5:涂抹消除与局部重绘 继续使用画笔,涂抹图片里闯入的小猫和背景墙面上的污渍进行消除,如图所示。 # 3.6 案例5:涂抹消除与局部重绘 点击“细节修复”和“HD超清”功能(如下图所示),最终得到涂抹消除杂物的图片(如图所示)。需要注意的是,“细节修复”功能会改变物体原貌,请酌情使用。 # 3.6 案例5:涂抹消除与局部重绘 步骤3:局部重绘操作。点击上方功能区中的“局部重绘”图标,默认选择是一个画笔样式,可以在图片中用画笔勾画出需要重绘的区域,也可以点击“快速选择”功能图标后,点击图片中的背景墙区域,将自动选取整个背景墙作为重绘区域,接下来就可以发挥自己的创意,在下方的文字输入框中输入“花朵随风飘落”,描述想要重新绘制的内容,还可以通过尝试修改输入框右侧的“重绘程度”,观察不同编辑策略对图片整体视觉焦点和氛围营造的作用,如图所示。 # 3.6 案例5:涂抹消除与局部重绘 输入“花朵随风飘落”,系统会智能生成四张效果图,如图所示。 # 3.6 案例5:涂抹消除与局部重绘 步骤4:优化处理。这里可以选择上一页中的第4张图,但图中的分界线太明显,不太美观,可以继续对该图进行了“涂抹消除”,还可以使用“细节重制”和“HD超清”功能对图片进行优化处理。原图和经过AI涂抹消除、局部重绘的效果对比,如图所示。 步骤5:效果整合与评估。将涂抹消除和局部重绘后的图片与原始图片进行对比,从图片的整洁度、创意元素添加效果、视觉吸引力等方面进行评估。总结不同涂抹参数和局部重绘策略在处理图片瑕疵和添加创意效果方面的实用性和灵活性,思考如何根据不同图片需求合理运用这些功能。 # 3.7 案例6:AI绘画艺术创作 这里利用豆包平台的AI绘画功能,以“水乡小镇的日常生活”为主题,创作四种风格的艺术作品。通过输入具体提示词和调整绘画风格,探索AI在表现真实生活细节和文化氛围中的潜力。具体风格包括:写实风格、中国工笔画风格、摄影风格和动漫风格。 步骤1:打开豆包平台“图像生成”功能模块。在浏览器中打开网址 https://www.doubao.com/chat/create-image,进入如图所示的页面。 # 3.7 案例6:AI绘画艺术创作 步骤2:生成写实风格的作品。在提示词输入框中输入提示词“江南水乡的小镇,清晨薄雾笼罩,小桥流水,白墙黛瓦的房屋倒映在河面上,居民划着小船,街边有小贩叫卖,画面真实而富有生活气息。写实风格,细节级别高,中等色彩饱和度。”,点击输入框右侧“发送”按钮,等待作品生成,系统会自动生成四张效果图,如图所示。 帮我生成图片:江南水乡的小镇,清晨薄雾笼罩,小桥流水,白墙黛瓦的房屋倒映在河面上,居民划着小船,街边有小贩叫卖,画面真实而富有生活气息。写实风格,细节级别高,中等色彩饱和度。 图像生成 2. 帮我写作 AI搜索 AI阅读 音乐生成 解题: 学术搜索 品+更多 # 3.7 案例6:AI绘画艺术创作 步骤3:生成中国工笔画风格的作品。在提示词输入框中输入提示词“江南水乡,小桥流水人家,白墙黛瓦,居民划着乌篷船,画面线条细腻,色彩淡雅,展现传统水乡之美。中国传统工笔画风格,线条精细度高,色彩层次清新淡雅。”,点击输入框右侧“发送”按钮,等待作品生成,系统会自动生成4张效果图,如图所示。 江南水乡,小桥流水人家,白墙黛瓦,居民划着乌篷船,画面线条细腻,色彩淡雅,展现传统水乡之美。中国传统工笔画风格,线条精细度高,色彩层次清新淡雅。 图像生成 帮我写作 AI搜索 AI 阅读 音乐生成 解题答 学术搜索 品\*更多 # 3.7 案例6:AI绘画艺术创作 步骤4:生成摄影风格的作品。在提示词输入框中输入提示词“江南水乡小镇,清晨薄雾中,小桥流水,居民划船而过,街巷安静,小贩开始摆摊,场景如同摄影作品般真实。摄影风格,光影效果:晨光柔和,细节刻画:真实细腻,画面比例:16:9(增强摄影感)。”,点击输入框右侧“发送”按钮,等待作品生成,系统会自动生成4张效果图,如图所示。 帮我生成图片:江南水乡小镇,清晨薄雾中,小桥流水,居民划船而过,街巷安静,小贩开始摆摊,场景如同摄影作品般真实。摄影风格,光影效果:晨光柔和,细节刻画:真实细腻,画面比例:16:9(增强摄影感)。 图像生成 帮我写作 AI搜索 AI阅读 音乐生成 解题答疑 学术搜索 品+更多 # 3.7 案例6:AI绘画艺术创作 步骤5:生成动漫风格的作品。在提示词输入框中输入提示词“江南水乡的小镇,小桥流水,乌篷船轻轻划过河面,居民与小贩互动,场景色彩明亮,线条简洁,画面具有卡通感和故事性,适合用作插图。线条风格:清晰明快,色彩饱和度:高,氛围效果:轻松生动,画面比例:4:3”,点击输入框右侧“发送”按钮,等待作品生成,系统会自动生成4张效果图,如图所示。 帮我生成图片:江南水乡的小镇,小桥流水,乌篷船轻轻划过河面,居民与小贩互动,场景色彩明亮,线条简洁,画面具有卡通感和故事性,适合用作插图。线条风格:清晰明快,色彩饱和度:高,氛围效果:轻松生动,画面比例:4:3 图像生成 帮我写作 AI搜索 音乐生成 解题答疑 学术搜索 更多 # 3.8 案例7:真实照片转成二次元风格 这里利用豆包平台的图像生成功能,将上传的一张真实照片,通过选择二次元风格转换选项,生成对应的二次元风格照片。 步骤1:打开豆包平台“图像生成”功能模块。在浏览器中打开网址 https://www.doubao.com/chat/create-image,进入图像生成功能页面。 步骤2:上传人物摄影照片。点击提示词输入框左下的“参考图”图标,开始上传一张人物摄影照片“人物摄影照片.jpg”(可以从本报告官网下载),如图所示。 # 3.8 案例7:真实照片转成二次元风格 步骤3:选择风格并补充提示词。上传完毕后,点击提示词输入框下方的“风格”图标,在弹出的风格选项中选择“二次元”,还可以在输入框里补充更多的提示词,比如“喝咖啡的少女,超高画质,多重细节,比例9:16”(如图所示)。 参考风格 图片风格为「二次元」,喝咖啡的少女,超高画质,多重细节,比例9:16 参考图 比例 风格 # 3.8 案例7:真实照片转成二次元风格 点击输入框右侧“发送”按钮,等待作品生成,最终生成了4张效果图,如图所示。 图片风格为「二次元」,喝咖啡的少女,超高画质,多重细节,比例9:16 0 图像生成 语音通话 翻译 山学术搜索 解题答疑 音乐生成 AI阅读 品更多 # 3.9 案例9:使用DeepSeek+即梦AI生成海报 # 案例:DeepSeek+即梦AI,生成教师节海报 第1步:登录DeepSeek,输入如下提示词: 我想用AI绘图软件绘制一张教师节海报,要加入厦门大学元素,请帮我写一段提示词 第2步:登录“即梦AI”,进入“AI作图”的“图片生成”,在提示词输入框中,把第1步DeepSeek生成的提示词粘贴进来,点击“立即生成” # 即梦-图片生成 02-23 21:50 主场景设定 阳光透过凤凰木枝叶洒向嘉庚建筑群(突出建南大礼堂琉璃瓦屋顶),芙蓉湖面泛起金色波光,营造庄重而温暖的校园氛围。核心主体 身着素雅旗袍的女教师立于古典讲台前,手持绽放的康乃馨与立体校徽图案卡片,黑板浮现「自强不息止于至善」烫金校训。 # 图片生成 视频生成 音乐生成 # 主场景设定 阳光透过凤凰木枝叶洒向嘉庚建筑群(突出建南大礼堂琉璃瓦屋顶),芙蓉湖面泛起金色波光,营造庄重而温暖的校园氛围。 核心主体 导入参考图 125/800 ③ # 案例:去除图片中的水印 # Baidu百度 百度一下 即刻体验AI搜索DeepSeek-R1满血版 带有水印的图片 # Hi, AI搜索已支持R1满血版,快来试试吧! 智能创作> 工作总结 节日祝福 朋友圈文案 发言稿 写评语 小红书文案 画图修图> 国风头像 涂鸦插画 卡通人物 变清晰 去水印 换风格 AI阅读> 上传文档 PDF/Word等 上传图片 jpg/png等 添加链接 支持各类链接 精选智能体> 法律助手 法行宝出品 代码助手 文心快码出品 工作总结 百度文库出品 去除水印后的图片 # 04 Part four # 语音类AIGC应用实践 本节所有内容有对应的教学视频(林子雨主讲)观看地址:https://dblab.xmu.edu.cn/post/ai/进入这个网页,下拉,找到“MOOC视频”栏目 # 4.语音类AIGC应用实践 # 语音类AIGC应用场景 # 案例1:豆包大模型的语音类功能用法 # 案例2:使用腾讯智影进行文本配音 # 案例3: 使用米可智能进行语音克隆 # 4.1 语音类AIGC应用场景 语音类AIGC的应用场景非常丰富: # 4.2 案例1:豆包大模型的语音类功能用法 一般情况下,普通用户在手机上使用语音类AIGC大模型的场景比较多,因此,这里介绍手机版豆包的使用方法。 在智能手机上下载并安装“豆包APP”。启动进入豆包APP,会出现如图所示的对话界面,按住“语音按钮”(图中箭头指向的位置)不要松开,然后就可以对着手机说话,把自己的需求说出来,比如,可以说“请介绍一下厦门大学”,然后松开“语音按钮”,豆包就可以立即开始回答你提出的问题。豆包可以支持实时翻译,你可以语音输入“厦门大学的英文名称是什么”,豆包会马上给出翻译结果。 中国移动08:49 豆包 doubao.com 我是你的新朋友豆包!初次见面很开心,我呢,可以回答你的各种问题,给你做作业学习上提供帮助,还能随时陪你聊聊,嗯,你想问点什么呢? 帮我写一个请假条 帮我做一个职业发展规划 图片生成 帮我写作 拍题答疑 # 发消息... # 4.2 案例1:豆包大模型的语音类功能用法 # 豆包不仅支持语音输入,也可以支持文字输入,只要在文字输入框内输入提示词,豆包就会给出回答。 豆包也支持AI绘图功能,你可以用手指点击图右所示界面左上角的“<”按钮,进入“对话”页面,在页面中点击“AI图片生成”按钮,然后输入提示词,比如通过文字或者语音输入“请帮我绘制一张图片,一个9岁的小女孩在海边沙滩上玩沙子”,然后,豆包就会自动绘制生成满足你要求的图片,并且可以把图片保存到手机中。 豆包还有一个很实用的功能,就是可以帮助你进行英语口语对话练习。你可以用手指点击图右所示界面左上角的“<”按钮,进入“对话”页面(如图左所示),在页面中选择“英语口语聊天搭子”就可以进入英语口语聊天界面(如图右所示),按住界面右下角的“语音按钮”,就可以开始用英语语音聊天了,你说完一句英语,松开语音按钮,豆包就会自动用英语语音回答你,然后你可以继续输入语音进行后续对话。 中国移动09:01 46 191% 中国移动09:02 46 192% 对话 英语口语聊天搭子@小图灵 ·· AI图片生成 一句话即可生成图片,支持多种风格,快... 高情商回复 把对方的消息和对方是谁告诉我,我来生... 超爱聊天的小宁 哈喽我是小宁,你的专属好友!欢迎... 英语口语聊天搭子 Hi, dear, 和我一起练习口语吧!不管是初... 学习小帮手 可以解答从小学到大学的各科题目,包... 输入姓名为你写诗 您给我姓名,我为您创作藏头诗或歌曲 对话 发现 创建 通知 我的 。 □ Hi, dear, 和我一起练习口语吧!不管是初学或练习我都能提供个性化的学习体验,我们可以先从一些常见的话题聊聊比如个人介绍、家庭朋友、兴趣爱好、学习工作等,开始吧! How do you do? Nice to meet you. Introduce yourself (介绍你自己) 发消息... # 4.3案例2:使用腾讯智影进行文本配音 这里借助腾讯智影创作工具,将文本内容自动转换为高质量的音频输出。 步骤1:登录腾讯智影平台。在浏览器地址栏中输入网址 "https://zenvideo.qq.com/”,进入“腾讯智影”平台,如图所示。点击登录,可使用微信登录、手机号登录或QQ登录,任选一种方式登录,也可以选择“账号密码”登录,按照提示完成账号的创建。 # 4.3案例2:使用腾讯智影进行文本配音 步骤2:输入文本内容。登录后,在平台的首页,找到“文本配音”的工具入口,如图4-1所示。点击“文本配音”,开始一个文本转音频的任务。在页面中(如图4-2所示),有一个文本输入框,最高支持8000字以内的文本配音,在此处可以选择粘贴或输入你想要转换成音频的文本内容(如图4-3所示),也可以通过导入文件的方法来输入文本内容,导入的文件支持doc、docx和txt等多种格式。需要注意的是,要确保文本内容清晰、准确,符合创作需求。 图4-1 图4-2 图4-3 # 4.3案例2:使用腾讯智影进行文本配音 步骤3:选择音色。在文本输入完成后,在左侧工具栏点击“选择音色”,进入全部主播的音色界面,如右下图所示,可以点击“全部场景”菜单里的不同场景,选择合适的音色和配音主播,也可以通过音色搜索框来搜索适配的音色,用这个音色完成配音。其中,在音色场景的功能选择里,支持的场景包括但不限于对话闲聊、新闻资讯、影视综艺、知识科普、游戏动漫、生活vlog和纪录片等等,而且可以支持多语种配音。点击每种音色的主播配音进行试听,聆听不同风格的音频样本,根据需求选择最合适的音色。本次配音我们选择“热门”场景中的“康哥-亲切中正青年男音”,来为本段文本配音,如左下图所示。同时,可以根据需要在文本框上方工具栏,调整主播语速、音量等参数,来满足文本配音需求。 需要特别说明的是,部分VIP主播的音色,需要充值或者成为会员才可以使用,这里选择非VIP主播音色,可以免费配音。 # 4.3案例2:使用腾讯智影进行文本配音 步骤4:试听与微调。选择确认好音色后,点击文本框下方的“试听”按钮,试听配音效果,并可以对“停顿”、“局部变速”、“词组连读”、“多音字”、“发音替换”等参数进行微调,让配音效果更加生动,如图所示。 # 康哥 三 插入停顿 # 局部变速 ABC 词组连读 Yin 音字 123 数字符 单词读法 与 发音替换 自 批量替 1 多发音人 # 音效 目 导入文本 21世纪,我们正经历一场由大数据引领的信息革命。大数据,以其海量、高速、多样的特性,成为新时代的智慧之光。随着云计算、物联网、AI技术的飞跃,大数据的收集、分析与应用能力大幅提升,深刻改变着商业、公共服务等领域。 在商业领域,大数据助力企业精准洞察市场,优化产品设计,实现个性化营销,提升运营效率,成为企业竞争的新高地。公共服务方面,政府利用大数据分析城市交通、环境监测等数据,制定科学政策,提升服务质量,解决社会问题。 然而,大数据的发展也面临数据隐私、安全、伦理等挑战。如何在保障隐私与安全的前提下,挖掘大数据价值,成为亟待解决的问题。加强法律法规建设,完善数据治理体系,提升公众数据素养,是构建健康大数据生态的关键。 展望未来,大数据将继续推动社会向智能化、高效化、个性化发展。人工智能、量子计算等前沿技术的突破,将进一步拓展大数据的应用范围,为解决全球性挑战、实现可持续发展提供强大支持。在这个大数据时代,每个人都是数据的创造者与使用者。我们应积极拥抱机遇,提升数据素养,共同推动大数据技术的健康发展,为构建更美好的数字世界贡献力量。大数据不仅是技术的革新,更是人类智慧的结晶,引领我们迈向更加光明的未来。 # 4.3案例2:使用腾讯智影进行文本配音 步骤5:添加配乐。如图所示,点击文本框左方的“添加配乐”按钮,为文本添加配乐,并调整背景音乐的音量大小到合适音量。 # 4.3案例2:使用腾讯智影进行文本配音 步骤6:生成并下载音频。调整完配音参数和添加完配乐后,点击“生成音频”按钮(如图4-4所示),即可完成音频的生成。音频生成完成后,如图4-5所示,可以点击“剪刀图标”,在弹出的界面(如图4-6所示)中进行在线音频剪辑,或者,也可以直接点击“下载”按钮,下载MP3格式的音频文件。最后,播放生成的音频文件,检查音质和内容是否符合预期。如有需要,可以根据需求调整文本或音色风格,重新生成。 图4-4 【大数据时代:信息革命的新篇...文本配音 图4-5 图4-6 # 4.4 案例3:使用米可智能进行语音克隆 这里使用米可智能AI创作工具,实现声音克隆,定制专属音色,并使用定制音色将文本内容自动转换为高质量的音频输出。 步骤1:登录米可智能平台。在浏览器地址栏中输入网址“https://minecho.com/”,进入“米可智能”平台,如图所示。点击“登录/注册”,可使用微信扫码登录或手机号登录,任选一种方式登录即可,登录成功后,点击“免费试用”按钮,进入“AI创作音视频”功能界面。 # 米可智能 产品 小程序 API 定价 中文 EN 登录/注册 # AI创作完美音视频 由人工智能驱动的一站式视频翻译、声音克隆等服务,将复杂操作极致简化、便捷高效,效率提升90%以上。 免费试用 # 4.4 案例3:使用米可智能进行语音克隆 步骤2:上传音频素材。进入“AI创作音视频”功能界面后,在功能界面找到“声音克隆”的工具入口,如图4-7所示,点击“声音克隆”,开始定制个性化的音色。在页面中(如图4-8所示),选择“即时克隆”,在“音色名称”下方文本框中输入音色名称,然后,上传音视频或直接录音,要确保只包含1个目标音色,发音清晰、流畅;针对有背景音的文件,AI将智能去除背景音、并进行降噪处理,所以,并不需要单独去消除背景音。 图4-7 # 克隆类型 ① # 时克隆 5-15秒音视频,半分钟即可完成克隆。 # 创建新的音色 上传仅包含一个人声的音视频,最快半分钟即可完成克隆;每个音色可以说15 种国际语言,且可用于视频翻译、AI配音等功能。 # 音色名称(可选) 请输入音色名称 # 语音文件① 上传音视频 $\mathbb{Q}$ 上传录音(推荐) 图4-8 # 4.4 案例3:使用米可智能进行语音克隆 需要特别说明的是,如果是选择上传音视频的方式,上传的音视频文件大小不要超过100MB,可以上传主流的音视频格式文件,如mp3、wav、m4a、mp4等;如果是选择上传录音的方式,需要根据例句进行朗读,朗读5-10秒,平台会根据真人音色,对情感、语调进行克隆。这里采用上传音频的方式定制音色,请提前将录制好的音频保存到本地(可以从本报告官网下载音频文件“史铁生《我与地坛》-音频.m4a”),方便直接上传。上传后,如图所示,选择源文件语言“汉语”,然后点击提交。 # 创建新的音色 上传仅包含一个人声的音视频,最快半分钟即可完成克隆;每个音色可以说15种国际语言,且可用于视频翻译、AI配音等功能。 克隆类型① # 即时克隆 5-15秒音视频,半分钟即可完成克隆。 # 高级定制 提升汉语、英语效果;人工降噪、优化发音;一个工作日完成;建议1分钟或以上音视频。 # 专业定制 提升15种语言效果:人工降噪、优化发音;三个工作日完成;建议3分钟或以上音视频。 音色名称(可选) 定制音色 语音文件① 史铁生《我与地坛》-音频.m4a $\odot$ 上传成功 源文件语言 ① 提交 # 4.4 案例3:使用米可智能进行语音克隆 步骤3:提交并完成音色克隆。提交后,任务将在云端后台自动执行,无需停留等待,仅需半分钟左右即可完成音色的克隆。克隆音色也称为声音克隆或语音合成定制,是一种深度学习算法,它能够接收个人的语音记录,并合成一段与源说话人非常相似的语音,用户只需要提供一段清晰的录音,就可以克隆出自己的声音。克隆完成的音色可在“我的音色”页面进行查看和管理,如图所示。 # 4.4 案例3:使用米可智能进行语音克隆 步骤4:使用克隆音色为文本配音。克隆成功的音色可直接应用于“视频翻译”和“AI配音”,每个克隆的音色都能支持15种国际主流语言。在平台左侧工具栏,选择“创作空间”,进入主功能界面,点击“AI配音”工具(如图1所示),进入AI配音页面(如图2所示),选择“发音人”和“发音语言”,并输入“文本内容”,为文本配音,这里选择“发音人”为定制音色,“发音语言”为汉语,并输入你想要配音的文本。 图1 # 创建新的配音 将文字转为自然生动的语音,可使用克隆、内置音色;长文本建议使用多人配音 # 4.4 案例3:使用米可智能进行语音克隆 步骤5:生成并下载音频。输入需要配音的文本后,点击“提交”按钮,即可完成音频的生成。音频生成完成后,如图所示,可以点击“下载”按钮,下载MP3格式的音频文件,也可以点击“分享”按钮,分享配音音频。最后,播放生成的音频文件,检查音质和内容是否符合预期。如有需要,可以根据反馈调整文本或音色,重新生成。 <返回 AI配音/定制音色_汉语_站在亭台上, # # # 05 Part five # 视频类AIGC应用实践 本节所有内容有对应的教学视频(林子雨主讲) 观看地址:https://dblab.xmu.edu.cn/post/ai/ 进入这个网页,下拉,找到“MOOC视频”栏目 # 视频类AIGC应用实践 视频类AIGC是指利用人工智能技术,特别是深度学习、机器学习等算法,自动创建或处理视频内容的技术。它能够根据给定的文本、图像或其他数据,自动生成符合描述的视频内容,涵盖文生视频、图生视频、视频风格化、人物动态化等多个方向。这一技术在创意设计、影视制作等领域展现出巨大潜力,极大地提升了视频内容的生产效率和质量。 # 5.1 视频类AIGC应用场景 # 视频类AIGC在多个领域拥有广泛的应用场景,以下是一些主要的应用方向: # 影视制作与后期制作 AIGC可以生成影片、动画、短视频等,具备专业级的画面效果和剧情呈现,为影视行业提供多样化的创意内容。在影视作品的后期制作中,AIGC技术可以协助进行视频剪辑、特效合成等工作,提升制作效率和质量。 # 短视频与直播 基于用户输入的文本或图像,AIGC可以快速生成符合需求的短视频内容,满足短视频平台的多样化需求。在直播过程中,AIGC技术可以用于生成虚拟主播、背景、道具等,为直播增添趣味性和互动性。 # 广告与营销 AIGC可以根据广告需求生成创意视频,帮助广告主快速制作高质量的广告内容。在电商领域,AIGC可以生成产品展示视频,以更直观的方式向消费者展示产品特点和使用效果。 # 教育与培训 AIGC可以生成教学视频,帮助教育机构和个人教师快速制作在线课程内容。在理工科教育中,AIGC可以生成虚拟实验视频,让学生在虚拟环境中进行实验操作,提高教学效果。 # 虚拟现实与增强现实 AIGC技术可以生成虚拟现实和增强现实内容,为用户提供沉浸式的视觉体验。在游戏开发中,AIGC可以生成游戏关卡、角色、道具、故事情节等,为游戏行业带来创新和多样性。 # 新闻传播与媒体融合 AIGC可以根据新闻事件自动生成新闻稿件,提高新闻资讯的时效性和传播效率。在新闻传播领域,AIGC可以生成AI合成主播进行新闻播报,为观众提供更加生动、形象的新闻信息。 # 其他领域 AIGC可以用于智能导游、虚拟现实体验等场景,提升旅游体验和游客满意度。在工业领域,AIGC可以生成产品演示视频、操作指南等内容,帮助企业员工更好地理解和掌握产品知识。 # 5.2 代表性的视频类AIGC大模型 视频类AIGC大模型发端于Sora。2024年2月,美国的Open AI发布了全球第一款文生视频大模型Sora(这里的“文生视频”是指由输入的文本内容生成相应的视频),迅速引起了业界的广泛关注和讨论,因其能够快速生成高质量的广告宣传视频及商品演示视频,从而大幅降低广告相关内容的制作成本及时间。 我国的视频类AIGC大模型主要包括: # 可灵 由快手推出,被誉为中国版Sora,视频生成时长可达120秒,支持文生视频、图生视频、视频续写、镜头控制等功能,表现出色。 # 即梦AI 即梦AI是字节跳动旗下的产品,它是一个生成式人工智能创作平台,支持通过自然语言及图片输入,生成高质量的图像及视频。提供智能画布、故事创作模式、以及首尾帧、对口型、运镜控制、速度控制等AI编辑能力,提供用户创意灵感、流畅工作流、社区交互等资源,为用户的创作提效。 # Vidu 生数科技联合清华大学发布,是中国首个长时长、高一致性、高动态性视频大模型,支持一键生成16秒高清视频,性能对标国际顶尖水平。 # 通义万相 是阿里云通义系列AI绘画创作大模型,支持文字作画、视频生成和应用广场等功能,拥有文生图、图生图、文生视频和图生视频等能力,可以辅助人类进行图片和视频创作,大幅降低图片设计和视频创作门槛。同时,还可以应用于艺术设计、游戏和文创等应用场景。 # 书生·筑梦 由上海人工智能实验室研发,可生成分钟级视频,已用于央视AI动画片《千秋诗颂》的制作,具备中国元素和高清画质。 # 剪映 是抖音官方推出的一款视频编辑应用,功能包括视频剪辑、文字成片、音乐合成、字幕制作、特效添加、字幕解说转换、水印祛除等。剪映的文字成片功能是一种通过输入文字内容自动生成视频的功能。用户只需在剪映应用中输入文案,系统会自动匹配图片、表情包,并配合朗读、字幕及配乐,生成完整的视频。这一功能特别适合刚开始视频创作的泛知识创作者,大大降低了视频制作的门槛。 # 5.2 代表性的视频类AIGC大模型 由于视频类AIGC大模型在使用时,会消耗大量的算力资源,使用成本很高,所以,目前国内的视频类AIGC大模型大多数没有免费开放给大众使用,即使是免费使用,也只能生成很短时间长度的视频。 # 5.3 案例1:使用可灵AI实现文生视频 这里使用可灵AI工具,根据文本内容自动生成高质量的视频。 步骤1:登录可灵AI平台。请确保你的计算机已连接到互联网,并打开一个常用的网页浏览器(如Chrome)。在浏览器地址栏中输入网址“https://klingai.kuaishou.com/”,进入“可灵AI”平台(如图2所示),点击页面右上角的“登录”按钮,可以使用“手机号+验证码方式”登录,也可以使用快手或快手极速版手机APP扫码登录。登录成功后,点击平台首页的“AI视频”功能(如图2所示),进入“文生视频”和“图生视频”功能界面,这里使用“文生视频”作为演示。 图1 图2 # 5.3 案例1:使用可灵AI实现文生视频 步骤2:输入创意描述。进入“文生视频”和“图生视频”功能界面后,点击“文生视频”按钮,在页面中(如图所示),有一个提示词输入框,在此处粘贴或输入你想要转换成视频的文本内容,字数控制在500字以内,要确保文本内容清晰、准确,符合创作需求。 # 5.3 案例1:使用可灵AI实现文生视频 温馨提示:输入的文本,也叫“提示词(Prompt)”,提示词作为文生视频大模型最主要的交互语言,将直接决定了模型返回的视频内容,因此,如何使用有效提示词来完成AI视频创作是非常重要的,为了帮助大家输入有效提示词和激发创作灵感,可灵发布的提示词公式(如图所示),可供大家参考。当然,也可以尽情发挥你的想象力,不被公式限制,从而创作有趣又惊喜的视频。需要注意的是,输入的文本要尽可能使用简单词语和句子结构,避免使用过于复杂的语言,画面内容也要尽可能简单,确保是在5s到10s内可以完成的画面表达。 提示词 = 主体 (主体描述) + 运动 + 场景 (场景描述) + (镜头语言 + 光影 + 氛围) 括号里的内容可选填 主体:主体是视频中的主要表现对象,是画面主题的重要体现者。如人、动物、植物,以及物体等; 主体描述:对主体外貌细节和肢体姿态等的描述,可通过多个短句进行列举。如运动表现、发型发色、服饰穿搭、五官形态、肢体姿态等; 主体运动:对主体运动状态的描述,包括静止和运动等,运动状态不宜过于复杂,符合5s视频内可以展现的画面即可; 场景:场景是主体所处的环境,包括前景、背景等; 场景描述:对主体所处环境的细节描述,可通过多个短句进行列举,但不宜过多,符合5s视频内可以展现的画面即可。如室内场景、室外场景、自然场景等。 镜头语言:是指通过镜头的各种应用以及镜头之间的衔接和切换来传达故事或信息,并创造出特定的视觉效果和情感氛围。如超大远景拍摄,背景虚化、特写、长焦镜头拍摄、地面拍摄、顶部拍摄、航拍、景深等;(注意:这里与运镜控制作区分) 光影:光影是赋予摄影作品灵魂的关键元素,光影的运用可以使照片更具深度,更具情感,我们可以通过光影创造出富有层次感和情感表达力的作品。如氛围光照、晨光、夕阳、光影、丁达尔效应、灯光等; 氛围:对预期视频画面的氛围描述。如热闹的场景、电影级调色、温馨美好等。 # 5.3 案例1:使用可灵AI实现文生视频 这里参考可灵的提示词公式,输入创意描述为“一个穿着红色连衣裙的女孩(主体)在咖啡厅看书(运动),书本放在桌子上,桌子上还有一杯咖啡,冒着热气,旁边是咖啡厅的窗户(场景),电影级调色”,如图所示。 # 创意描述 一个穿着红色连衣裙的女孩在咖啡厅看书,书本放在桌子上,桌子上还有一杯咖啡,冒着热气,旁边是咖啡厅的窗户,电影级调色 57/500 推荐尝试: 骆驼 柯基 宇航员 兔子 金字塔 # 5.3 案例1:使用可灵AI实现文生视频 步骤3:设置视频参数。在提示词输入完成后,在平台左侧工具栏的提示词输入框下方,可以设置视频输出参数,如图所示,这里设置创意想象力和创意相关性为“0.5”,生成模式为“高品质”(非会员用户限时免费体验5次),生成时常为“5s”,视频比例为“16:9”,生成数量为“1条”。 特别说明:可灵1.0版本,可自由选择生成模式是“标准”还是“高品质”,其中“标准”模式消耗10灵感值,“高品质”模式消耗35灵感值。可灵1.5版本,只能选择“高品质”模式,消耗35灵感值。新用户每日登录可灵AI平台,可以获得66“灵感值”。这些灵感值可以用于兑换可灵AI平台内的指定功能使用权或增值服务,例如生成视频等。这里采用可灵1.0版本。 # 5.3 案例1:使用可灵AI实现文生视频 步骤4:增加运镜控制。视频参数设置完成后,可根据需要适当增加运镜控制,目前可灵1.0版本支持“水平运镜”、“垂直运镜”、“拉远/推进”、“垂直摇镜”、“水平摇镜”和“旋转运镜”等6种运镜控制,如图所示;可灵1.5版本暂不支持运镜控制。这里采用可灵1.0版本,因此,可以设置运镜方式为“拉远/推进”,生成具有明显运镜效果的视频画面。 # 5.3 案例1:使用可灵AI实现文生视频 步骤5:过滤不希望呈现的内容。此处为非必填项,可以根据个人对输出视频的需求输入不希望呈现的内容,字数不超过200字。这里设置不希望呈现的内容为“模糊”、“低质量”、“扭曲”,如图所示。 # 5.3 案例1:使用可灵AI实现文生视频 步骤6:生成并下载视频。设置完视频的参数、运镜控制和过滤不希望呈现的内容后,点击“立即生成”按钮(如图1所示),此视频由于选择“高品质”生成模式,因此点击生成会消耗35灵感值。点击生成按钮后,系统开始利用大模型将文本自动转换为视频。处理时间取决于文本长度和系统负载,请耐心等待。一旦视频生成完成,点击“下载”按钮,免费下载带水印的视频(如图2所示),如果需要不带水印的视频,可开通会员获取。最后,播放生成的视频文件,检查视频画面是否符合预期。如有需要,可以根据反馈调整文本或视频参数,重新生成。 图1 图2 # 5.4案例2:使用即梦AI实现图生视频 这里使用即梦AI工具,根据输入的文本内容自动生成高质量的图片,然后再利用该图片,使用即梦AI的“AI视频”功能,自动生成高质量的视频。 步骤1:登录即梦AI平台。在浏览器地址栏中输入网址 "https://jimeng.jianying.com/”,进入“即梦AI”平台(如图1所示),点击页面右上角的“登录”按钮,可以使用手机抖音APP扫码登录,或者使用“手机号+验证码方式”授权登录。登录成功后,点击平台首页的“AI作图”功能(如图2所示),进入“AI作图”功能界面。 图1 图2 # 5.4案例2:使用即梦AI实现图生视频 步骤2:输入图片描述,设置图片生成参数。进入“AI作图”功能界面后,点击“图片生成”按钮,如图1所示,在页面中,有一个提示词输入框,在此处可以输入你想要生成图片的文本描述,字数控制在800字以内,要确保文本内容清晰、准确,符合创作需求,也可以根据需要在文本描述后“导入参考图”,让AI生成的图片更符合你的预期。例如,输入想要生成的图片描述为“一只可爱的小狗坐在公交车座位上”,如图2所示。 图1 图2 # 5.4案例2:使用即梦AI实现图生视频 然后,在提示词输入框下方设置图片生成的“模型”和“比例”参数,如图所示,这里选择“图片生成模型”为“图片2.0pro”(目前即梦AI有5种生图模型可供选择);选择图片比例为“16:9”,设置完图片生成参数后,点击“立即生成”按钮,生成图片。 特别说明:图片生成会消耗1积分,即梦AI平台会为每个新登录的用户赠送100积分,这些积分可以用于兑换即梦AI平台内的指定功能使用权或增值服务,例如图片生成和视频生成等。 # 5.4案例2:使用即梦AI实现图生视频 步骤3:生成图片。点击“立即生成”按钮后,平台会自动生成4张不同风格的图片(如图1所示),选中你喜欢的图片,可以对你喜欢的图片进行“发布”、“下载”和“收藏”,也可以对你喜欢的图片进行“超清”设置、“细节修复”和“视频生成”(如图2所示),如果对生成的图片不满意,也可以点击图片下面的“重新生成”按钮,重新调整文本输入和图片参数设置,重新生成图片。 即梦-图片生成 12-17 12:20 一只可爱的小狗坐在公交车座位上 图片2.0Pro 16:9 # 5.4案例2:使用即梦AI实现图生视频 步骤4:使用图片生成视频。图片生成后,可以点击你喜欢的一张图片,例如,这里选择第一张图片作为演示,如图1所示,在图片的可编辑功能项中点击“生成视频”按钮。平台会进入“视频生成”功能界面(如图2所示),平台已自动添加第一张图作为生成视频的图片素材。 图1 图2 # 5.4案例2:使用即梦AI实现图生视频 步骤5:添加图片描述。在已添加的图片下方(如图所示),可以输入图片描述,描述你想生成的画面和动作,如添加图片描述为“小狗在行驶的公交车上看着窗外,吐着舌头”。 # 5.4案例2:使用即梦AI实现图生视频 步骤6:设置视频生成参数。添加图片描述文字后,在描述文字下方设置“视频模型”和“基础设置”,如图所示,首先选择“视频模型”为“视频S2.0Pro(更合理的动效,更生动自然的运镜)”,目前即梦AI平台支持4种可选的视频生成模型;然后选择“基础设置”里的“生成时长”为“5s”,“视频比例”参数平台会根据图片的比例自动匹配,无需设置;最后点击“生成视频”按钮,提交平台生成视频。 # 5.4案例2:使用即梦AI实现图生视频 步骤7:生成视频并为视频添加配乐。点击“生成视频”按钮后,系统开始根据图片自动生成视频。视频生成完成后,点击视频下方的“AI配乐”按钮(如图1所示),平台左侧会出现“AI配乐”功能界面,如图2所示, 图1 图2 # 5.4案例2:使用即梦AI实现图生视频 可以选择“根据画面配乐”,也可以选择“自定义AI配乐”,这里选择“根据画面配乐”,点击“生成AI配乐”按钮,平台自动根据画面为视频配3种音乐(如图所示),这里选择“配乐2”作为视频配乐。 特别说明:在生成视频过程中,点击“生成视频”会消耗20积分。在AI配乐过程中,点击“生成AI配乐”会消耗5积分。 # 5.4案例2:使用即梦AI实现图生视频 步骤8:下载或发布视频。确认配乐后,即可点击“下载”按钮(如图所示),免费下载带水印的视频,如果需要不带水印的视频,可开通会员获取;也可以点击“发布”按钮发布视频。最后,播放生成的视频文件,检查视频画面是否符合预期。如有需要,可以根据反馈调整图片或视频参数,重新生成。 # 5.5 案例3:使用腾讯智影生成数字人播报视频 这里使用腾讯智影工具,根据PPT内容自动生成数字人播报视频。 # 步骤1:登录腾讯智影平台。在浏览器地址栏中输入网址 "https://zenvideo.qq.com/”,进入“腾讯智影”平台,点击“登录”(如图1所示),可以使用微信扫码登录、也可以手机号登录或者QQ扫码登录,任选一种方式登录即可。登录成功后,点击平台首页“智能小工具”栏目中的“数字人播报”按钮(如图2所示)或者“智能小工具”上方的“数字人播报”按钮,进入“数字人播报”功能界面。 图1 图2 # 5.5 案例3:使用腾讯智影生成数字人播报视频 步骤2:上传PPT。进入“数字人播报”功能界面后(如图所示),在左侧工具栏,点击“PPT模式”,平台会出现“上传PPT或PDF”的界面,点击“上传”按钮,上传需要播报的PPT,这里上传“数字人播报PPT.ppt”文件(可以从本报告官网下载)。 # 5.5 案例3:使用腾讯智影生成数字人播报视频 步骤3:选择数字人。PPT上传结束后,点击左侧工具栏“数字人”按钮,会出现“数字人”设置界面,包括“预置形象”和“照片播报”两大板块(如图1所示)。“预置形象”分为“2D数字人”和“3D数字人”;“照片播报”分为“照片主播”和“AI绘制主播”两种(如图2所示)。这里选择“预置形象”里面的“2D数字人”——卓好数字人,作为PPT播报的数字人。 图1 图2 # 5.5 案例3:使用腾讯智影生成数字人播报视频 步骤4:调整数字人的位置、大小和服装类型。选用的数字人确认后,可以点击PPT上的“数字人”,进入“数字人”设置界面,点击“数字人编辑”按钮(如图1所示),对“数字人”进行编辑,可以重新换服装以及选择数字人出现的“形状”;点击“画面”按钮,可以通过坐标设置来调整数字人的位置和大小(如图2所示),也可以点击数字人的边框,通过拖动鼠标来调整数字人的位置和大小。这里可以根据PPT画面的布局来调整“数字人”的位置和大小,尽量避免数字人遮挡文字。 图1 图2 # 5.5 案例3:使用腾讯智影生成数字人播报视频 步骤5:输入播报内容和设置字幕样式。数字人调整完成后,点击右侧工具栏的“播报内容”按钮(如图1所示),输入播报内容,播报内容可以AI自动生成,也可以手动输入或导入文件(字数不超过5000字),这里选择“手动输入”每页PPT的播报内容。点击右侧工具栏的“字幕样式”按钮(如图2所示),设置视频字幕的样式并打开字幕显示按钮,通过鼠标拖动把字幕放置画面的合适位置。 图1 图2 # 5.5 案例3:使用腾讯智影生成数字人播报视频 步骤6:根据需要添加“背景”、“贴纸”、“音乐”并选择播报音色。输入完播报内容后,可以点击左侧工具栏的“背景”、“贴纸”和“音乐”等功能(如图1所示),根据需要添加,这里选择不添加背景、贴纸和音乐。确认后,点击“播报内容”输入框下方的“音色”按钮,选择合适的音色。这里选择“如云”音色作为PPT的数字人播报音色(如图2所示)。 图1 图2 # 5.5 案例3:使用腾讯智影生成数字人播报视频 步骤7:保存并生成播报。选择完音色后,点击“音色”下方的“保存并生成播报”按钮(如图所示),选中每一页PPT,逐一点击保存并生成播报,注意,平台此时生成的数字人播报效果预览,暂不支持口型对齐预览,合成后可查看完整动态效果。 # 5.5 案例3:使用腾讯智影生成数字人播报视频 步骤8:合成并下载视频。保存并生成每页的PPT的播报后,点击页面右上方的“合成视频”按钮(如图1所示),然后设置合成视频输出的参数(如图2所示)。 图1 图2 # 5.5 案例3:使用腾讯智影生成数字人播报视频 设置完成后点击“确认”按钮,系统后台会自动合成数字人播报视频,等待合成结束后,点击“下载”按钮(如图所示),下载合成的数字人播报视频。最后,播放合成的视频文件,检查视频画面是否符合预期。如有需要,可以根据反馈调整参数,重新生成。 全部 # 数字人播报PPT 视频剪辑 # 06 # Part six # AIGC技术在辅助编程中的应用 厦门大学大数据教学团队作品 # 6. AIGC技术在辅助编程中的应用 AIGC技术在辅助编程中的应用日益广泛,它能够自动生成高质量的代码,从而显著提高开发效率,主要包括以下几种应用场景: 能够提供辅助编程服务的AIGC大模型包括Codex、GitHub Copilot、CodeGeeX、aiXcoder、豆包、通义灵码等 # 6. AIGC技术在辅助编程中的应用 这里以我国的字节跳动公司研发的豆包大模型为例介绍使用方法。 编程工作一般都是在电脑上进行,所以,这里使用电脑端的豆包大模型(当然,手机端的豆包APP也提供了编程辅助功能)。在计算机上使用浏览器访问豆包大模型官网 (https://www.doubao.com/),注册用户以后,进入大模型操作首页(如图所示)。 你好,厦大林子雨 准备好了吗?我随时可以开始哦! # AI搜索 实时资讯,丰富信源,整合搜索 # 帮我写作 多种体裁,润色校对,一键成文 # 图像生成 自定风格,搜集灵感,复制同款 # AI阅读 论文课件,财报合同,翻译总结 # <Al编程 秒懂代码,智能编码,项目精解 # 品 品 更多 点击展示更多技能 图像生成 帮我写作 AI搜索 AI阅读 学术搜索 解题答疑 音乐生成 品更多 # 6.AIGC技术在辅助编程中的应用 点击“AI编程”,然后,在页面中输入提示词,比如输入“请编写一段Python代码,使用 turtle库,绘制一个五角星”,然后,豆包就会自动生成一段Python代码(如图所示)。在Python中运行这段代码,就可以成功绘制一个五角星。 请编写一段Python代码,使用turtle库,绘制一个五角星 以下是一段使用Python的turtle库绘制五角星的代码: 这段代码首先导入了 turtle 库。然后定义了一个名为 draw_pentagon 的函数,在函数内部,通过不断调整角度和前进距离来绘制五角星的五条边。最后使用 turtle_done() 来保持图形窗口的显示。 # 6.AIGC技术在辅助编程中的应用 在DeepSeek中输入以下提示词,生成html 设计一个豆苗在 $45^{\circ}$ 斜射光下生长的 28 天动态缩时动画, 展示茎秆弯曲角度变化, 要求: (1) 豆面要画得尽量逼真, 有细节 (2) 要画出阳光的样子, (3) 以 HTML 代码输出, 确保可以直接运行 # 6.AIGC技术在辅助编程中的应用 在DeepSeek中输入以下提示词,生成html 请帮我列出水晶情况,并分析种类、功效和适合人群信息,以表格的形式呈现,最终以html方式输出,html要可以直接运行,页面要提供可以直接下载word和Excel的功能 常见水晶功效对照表 (10种核心品类) <table><tr><td>水晶种类</td><td>核心功效</td><td>适合人群</td></tr><tr><td>白水晶</td><td>净化负能量/增强专注力</td><td>学生党/能量敏感者</td></tr><tr><td>紫水晶</td><td>增强直觉力/助眠</td><td>备考族/创意工作者</td></tr><tr><td>黄水晶</td><td>吸引财富/提升行动力</td><td>创业者/销售从业者</td></tr><tr><td>粉水晶</td><td>修复情感创伤/招桃花</td><td>单身人群/失恋者</td></tr><tr><td>黑曜石</td><td>辟邪护身/吸收负能量</td><td>敏感体质/高压人群</td></tr><tr><td>绿幽灵</td><td>提升事业运/招正财</td><td>管理层/项目负责人</td></tr><tr><td>蓝晶石</td><td>增强沟通/冷静思考</td><td>教师/谈判专家</td></tr><tr><td>月光石</td><td>平衡情绪/提升魅力</td><td>女性/亲密关系维护者</td></tr><tr><td>石榴石</td><td>促进血液循环</td><td>体寒者/气血不足者</td></tr><tr><td>虎眼石</td><td>增强执行力</td><td>拖延症人群</td></tr></table> # 6.AIGC技术在辅助编程中的应用 在DeepSeek中输入以下提示词,生成html 画一个任意三角形,标出三个内角的角度值,并满足以下要求:(1)可以拖动任意点,内角度数实时变化,(2)并以 HTML 代码输出,并确保代码能够直接运行 # 6.AIGC技术在辅助编程中的应用 在DeepSeek中输入以下提示词,生成html 生成《秋天的雨》课文中的‘摇花乐’场景,包含飘落桂花、风声和甜香气味标识,并以 HTML 代码输出 # 摇花乐 桂花纷纷落下来,落得我们满头满身,我就喊:“啊!真像下雨,好香的雨啊!” 母亲说:“这里的桂花再香,也比不上家乡院子里的桂花。” # 6.AIGC技术在辅助编程中的应用 在DeepSeek中输入以下提示词,生成html 创建光的折射动态演示,展示光线从空气进入水中的路径变化,标注入射角与折射角度数,以 HTML 代码输出 入射角度: ${30}^{ \circ }$ # 6.AIGC技术在辅助编程中的应用 请设计一个小圆球在正六边形内被不断弹起的动画,以html格式输出,要求:(1)小球的运动和碰撞符合物理规律,(2)小球整体在六边形里面,不能超出六边形边界,(3)html代码要能直接运行 # 07 Part seven # AI搜索 # 7.AI搜索 在信息如潮涌的时代,如何快速精准地获取所需知识,成为每个人的必修课。传统搜索方式有时难以满足复杂需求,AI搜索应运而生。它凭借强大的智能算法,打破信息壁垒,为求知者提供更高效、更个性化的答案。 # AI搜索概述 # 纳米AI搜索 # 7.1 AI搜索概述 AI搜索,即人工智能搜索引擎,是一种利用先进的人工智能技术,特别是深度学习和自然语言处理(NLP),来理解和响应用户的查询需求的新型搜索工具。 它不仅仅是传统搜索引擎(比如百度)的简单升级,而是通过模拟人类的思维方式和行为模式,为用户提供更加精准、个性化且高效的信息检索服务。 AI搜索通过收集和分析用户的历史搜索数据和行为模式,构建用户画像,从而实现更加精准的个性化搜索服务。这种数据驱动的智能决策机制,使得AI搜索能够不断自我优化,提升用户体验。 # 7.1 AI搜索概述 # AI搜索的核心特点包括: 语义理解和深度学习 多模态交互 自适应学习 AI搜索的应用场景主要包括: 01 专业领域的应用 02 日常生活的应用 # 7.2 纳米AI搜索 纳米AI搜索是360公司在2024年12月推出的全新AI搜索应用。其核心特点包括: 01 # 多模态搜索 支持文字、语音、拍照、视频等多种输入方式,满足不同场景下的需求,实现“一切皆可搜索”。 02 # 智能工具集成 内置16款顶尖大模型,如豆包、文心一言等,为用户提供一站式AI智慧体验。 03 # 慢思考模式 通过专家协同和多模型协作,深入分析复杂问题,提供更专业、更全面的答案。 # 7.2 纳米AI搜索 AI纳米搜索集成了多种功能模块,为用户提供全方位的搜索、学习、写作和创作体验: # 7.2 纳米AI搜索 纳米AI搜索在多个领域都能发挥重要作用,以下介绍一些常见应用场景的具体使用方法: # 8 AI智能办公 WPS Office AI写作助手(帮我写、帮我改、AI伴写) AI设计助手(AI排版、AI格式) AI阅读助手(全文总结、文档问答、划词解释和翻译) AI数据助手(AI写公式、AI数据分析) # 8 AI智能办公 # WPS灵犀 ■ 一键生成PPT AI搜索、读文档、快速创作、长文写作 网页摘要、截图问答、自动数据分析 搜全网 读文档 快速创作 生成PPT 长文写作 数据分析 品更多 提问、选择技能或试试@ DeepSeek R1 + WPS Office WPS灵犀 WPS灵犀 Beta 即 新话题 AI写作 AI PPT AI搜索 AI 阅读 AI PPT 输入灵感,灵犀一键生成PPT 输入PPT的主题及要求 DeepSeek R1 $\oplus$ 联网搜索 页数/默认 # 8. 本章小结 AIGC技术正逐步渗透并深刻影响着人类社会的未来。它不仅重塑了创意产业的边界,让艺术、设计、文学等领域的创作更加高效且充满无限可能,还极大地推动了科技、教育、医疗等行业的智能化转型。 在AIGC的助力下,信息获取与处理的速度空前提升,个性化内容与服务成为常态,极大地丰富了人们的生活体验。未来,随着AIGC技术的不断成熟与应用深化,人类社会将迎来更加智能、高效、多彩的新时代。 # 谢谢 厦门大学大数据教学团队作品 2025年5月2日