https://www.bilibili.com/video/BV1KzDYBYED6/?p=3&share_source=copy_web&vd_source=63c6218111021d177660d3bec318e593

产品经理最重要的的是懂技术边界

重要的是懂行业

因个人目标行业是例如博采影视这样的人工智能*影视行业,因此本文多用AI影视行业举例

逐步懂功能,懂梯度,懂场景,懂行业

1.AI产品的数据流向

博采传媒・墨客 AI(Kmoke)举例:

2.常用AI算法解析

2.1自然语言生成NLG

AI影视行业场景 输入 输出 算法边界限制
剧本创作 故事核心创意 完整影视对白剧本 剧情逻辑连贯性不足,人物行为不符合影视叙事逻辑,无法规避版权雷同风险
广告分镜 短片拍摄主题 标准化镜头台本文案 镜头专业度不足,无法匹配实拍光影、运镜落地限制,品牌合规文案易违规

2.2语音识别

严重依赖模式匹配和收音设备

需要根据场景训练

 

AI影视行业场景 输入 输出 算法边界限制
影片语音转字幕 影视剧人物对白音频 成片同步字幕文本 嘈杂背景音、多人重叠对话、小众方言识别失效,无法区分情绪语气
配音台词校对 广告旁白录音素材 标准化配音台词文稿 长音频断句错乱,影视专业术语识别不准,无法适配语速过快 / 吞音口语

2.3虚拟现实(以人为中心)

AI影视行业场景 输入 输出 算法边界限制
VR 舞台全景直播(中国好声音) 360° 舞台全景影像 沉浸式 VR 综艺观影成片 快速舞台灯光易画面撕裂,多人动态走位易畸变,长时间观看易眩晕
综艺虚拟场景包装 720° 现场环拍数据 SR 全景虚拟演播场景 光影实时匹配难度大,镜头切换易穿帮,无法适配高速舞台运镜
技术 全称 核心区别 影视 & 好声音应用案例
VR 虚拟现实 完全沉浸式虚拟空间,脱离真实环境 好声音 360° 全景沉浸式观看舞台
AR 增强现实 真实场景叠加虚拟信息、特效 直播画面叠加歌词、舞台虚拟光影字幕
MR 混合现实 虚实深度融合,虚实物体可交互遮挡 虚拟嘉宾与好声音真人同台同台演出
SR 全景重建 实景 360/720° 采集,高清还原全景空间 好声音现场环拍,重构超清全景影视画面

2.4机器学习平台

一般是一种有监督学习,范围面很广

AI 影视行业场景 输入 输出 算法边界限制
影视热度票房预判 历史剧集播放、票房、口碑数据 预测新片上线热度、市场收益走势 无法预判突发舆情、政策调整,小众题材数据样本匮乏,预测误差较高
AI 镜头智能生成 历史影视镜头风格、叙事特征数据 匹配叙事逻辑生成连贯影视画面 跨镜头画面逻辑易断层,复杂光影运镜特征学习不足,细节容易失真崩坏

2.4.1深度学习

  • 普通机器学习:浅层算法,靠人工提取画面、剧情特征
  • 深度学习神经网络:多层隐藏层结构,自动逐层提取影视画面、音频、文本深层特征
  • 是影视 AI 生成、AI 剪辑、AI 分镜的核心底层技术

2.5.针对ai优化的硬件和芯片

  • GPU:AI 神经网络并行运算,负责影视画面生成、特效渲染
  • ISP/DSP:音视频信号处理,负责影片画质、音频优化修复
  • CPU:整体流程调度,统筹影视 AI 全链路任务

2.6决策管理系统

AI 影视行业场景 输入 输出 算法边界限制
院线电影票房盈亏智能决策 影片题材、演员阵容、档期、过往同类型影片数据 自动判断是否立项拍摄、预估回本周期、最优上映档期 无法预判观众突发口碑、突发舆情、政策档期调整
短视频影视账号内容智能规划 用户过往爆款视频数据、热门影视话题库 自动推荐选题、更新频率、脚本风格、流量投放方案 跟不上突发网红热点变化,小众个性化内容推荐不准

2.8生物特征识别技术

AI 影视行业场景 输入 输出 算法边界限制
影院观众人脸情绪分析 现场观众面部影像 观影情绪、影片口碑反馈 口罩、侧脸遮挡识别失效,暗光环境准确率大幅下降
片场步态动作智能捕捉 演员行走肢体步态数据 角色动作还原、表演姿态校准 戏服遮挡、剧烈动作易特征失真,动态轨迹匹配出错

2.9RPA(机器人流程自动化

RPA 就是机器人自动干重复死板的固定流程工作

需求 = 要做什么事 → 规则 = 按什么规矩做 → 目标 = 做完得到什么结果

AI 影视行业场景 输入(需求:要做什么) 规则(做事规矩) 输出(目标:做完效果) 局限坏处
电影票房每日对账 各大平台每日票房数据 按院线分成比例自动算账 自动算出每日盈亏、结算报表 平台数据格式一变,机器人就算错,不会灵活变通
影视弹幕违规过滤 全网影片观众弹幕内容 脏话、低俗、敏感词筛查规则 自动删掉不良弹幕,保留正常评论 谐音梗、阴阳怪气的话识别不出来

2.10NLP(自然语言处理)

AI 影视行业 NLP 场景 输入 输出 算法边界限制
影视歌词全层级内核解读 歌曲歌词、节目台词文本 逐层解析播出环境、观众行为、演唱能力、歌曲信念、人物身份、作品精神主旨 文艺朦胧歌词、双关隐喻内容易解读偏差,无法精准共情深层情感
影视剧角色人物层级画像 角色剧本台词、剧情文案、人物采访 梳理故事环境、角色行为、表演能力、人物信念、角色身份、内核精神 反转多面人设识别不准,隐晦内心潜台词无法深度挖掘

2.11知识图谱

AI 影视行业知识图谱场景 输入 输出 算法边界限制
影视 IP 人物剧情关系网构建 剧本、影评、采访等零散非结构化影视文档 人物参演关联、剧情脉络结构化知识图谱 同名艺人、同音影视名称易匹配错乱,隐晦幕后人物关系无法识别
影视内容智能检索问答服务 用户剧情、人物相关搜索提问 多维人物导航、深度剧情溯源、精准智能问答 多线复杂叙事逻辑推理不足,抽象隐喻剧情问答容易出错

2.12机器学习

AI 影视行业机器学习场景 输入 输出 算法边界限制
影视人脸特征分级识别 海量演员人脸原始影像大数据 逐层提取五官底层、面部中层、人物高层特征,识别演员身份 美颜化妆、光影变化、侧脸遮挡会导致特征提取错乱,识别准确率下降
影片票房热度规律预测 往期影视票房、观众喜好大数据 挖掘影片热度内在规律,预测后续上映票房走势 突发舆情、档期变动无法适配已有数据模式,预测结果严重偏差

2.13强化学习

自己感知,在环境中学到策略

AI 影视行业强化学习场景 输入 输出 算法边界限制
影视院线最优排期策略优化 市场环境状态、影片上座率反馈奖励 智能 Agent 不断迭代试错,输出票房收益最高上映排期方案 全新冷门影片无历史经验参考,环境突发变动无法快速适配最优策略
虚拟影视角色互动动作优化 剧情场景状态、观众好评度奖励反馈 AI 自主学习最优表演动作、对话交互策略 非常规突发剧情场景无过往经验,无法精准匹配贴合人设的行为选择

3.AI影视行业常用算法

1、GAN 生成对抗网络

AI 影视行业 GAN 场景 输入 输出 算法边界限制
AI 影视虚拟人脸 / 数字演员生成 真人演员面部特征数据 高度还原真人神态、五官细节的虚拟数字人 极端表情、光影畸变易面部崩坏,细节质感不如真人实拍

2、YOLO 目标检测算法

AI 影视行业 YOLO 场景 输入 输出 算法边界限制
影视片场人物 / 物体智能跟踪 影视拍摄画面帧序列 精准追踪演员、道具运动轨迹,自动锁定拍摄主体 多人重叠遮挡、快速模糊运动,极易丢失跟踪目标

3、Transformer 大模型架构

AI 影视行业 Transformer 场景 输入 输出 算法边界限制
长剧集影视剧本连贯创作 长篇故事设定、人物小传 跨集连贯剧情、前后呼应台词、完整影视 IP 故事 超长文本逻辑易前后矛盾,人物人设容易崩坏断层

4、图像超分辨率重建

AI 影视行业超分场景 输入 输出 算法边界限制
老电影胶片画质修复翻新 模糊老旧低清影视胶片画面 4K 高清无损复古影视成片 剧烈动态模糊画面修复易拖影,复杂纹理细节失真

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐