
什么是 VideoTutor
VideoTutor 是一家位于硅谷的 AI 教育产品团队,主打“生成式视频讲解(Generative Video Explainer)”。它的核心理念是:学生只需提出一个问题(如一道数学题、一个概念或一张题目截图),系统就会自动生成一段结构清晰、逐步推演的教学视频,像看可汗学院那样,但内容完全围绕你的问题进行个性化讲解。官网当前显示为 “VideoTutor Beta”。
从公开信息可见,VideoTutor 自称“世界上首个教育 Agent(The World’s First Education Agent)”,主攻 K-12 到大学早期阶段的学科学习与考试备考场景(如 Algebra、Calculus、Geometry、Statistics 等),并面向不同学段提供个性化学习路径与视频示例展示区(Discover Videos)。官方页面同时标注“8 Languages Supported”。
在用户规模与融资方面,官方与多家媒体报道显示,项目在 2025 年启动后快速发展:与 MiniMax 达成语音技术合作(MiniMax-Speech-02),并于 2025 年 10 月宣布获得 1100 万美元种子轮融资(由 YZi Labs 领投)。
核心技术说明
VideoTutor 的技术路径可概括为“三段式管线”:① 由大型语言模型(LLM)对用户问题进行教学脚本与场景规划;② 基于程序化动画引擎将公式、图形与步骤可视化(业界报道提及其 Manim-based 渲染管线);③ 采用高保真多语言 TTS(与 MiniMax-Speech-02 合作)生成人类自然度较高的旁白,使得同一知识点可按学生年级与母语做风格化呈现。
整体来看,VideoTutor 将“文本理解→可视化推演→多语音讲解”整合为一个自动化生成工作流,定位于“面向考试与概念理解的教学视频即时生成”,目标是显著降低传统辅导的时间与金钱成本。
• 2025/10:宣布完成 1100 万美元种子轮融资,投资方包括 YZi Labs(领投)等;产品继续聚焦 K-12 与 SAT/AP 等考试场景。
• 官网处于 Beta 阶段,并展示学段化版块与示例视频区。
🚀 VideoTutor 能做什么 · 主要功能解释
一句话提问,秒级生成个性化教学视频
用户输入一道题或一个概念(也可粘贴题干文本),系统会自动完成“脚本规划 → 场景拆分 → 逐步讲解”的流水线生成,输出结构化讲解视频,强调“像老师一样”按步骤说明推导逻辑与解题要点。
题目截图/图片理解与讲解
除纯文本问题外,VideoTutor 也支持基于截图的题目理解与讲解(如选择题、图形题等)。系统会先识别关键信息,再生成对应的讲解动画与语音旁白,适合作业题、试卷题等真实场景。
多语言语音与字幕支持
得益于与专业 TTS 模型的集成,讲解视频可提供多语种旁白与字幕;针对不同年龄层、母语与学习情境可做语音风格化配置,提升非母语学生的理解效率与沉浸感。
数理可视化渲染(公式、图形与几何动态演示)
在数学与理科场景中,VideoTutor 使用程序化动画渲染技术对方程、函数图像、几何作图、统计图表等进行动态演示,将“口头解释”转化为“可看见的推导过程”,显著降低理解门槛。
学段化与考试场景覆盖(K-12 / SAT / AP)
产品首页按学段(小学/初中/高中/大学与以上)组织内容,重点面向 K-12 及 SAT/AP 等考试备考需求,能把抽象知识点与考纲要求对应起来,帮助学生快速进入“会考、会做”的状态。
社区与示例视频发现(Discover Videos)
平台提供“From the community / Discover Videos”内容区,便于学生浏览他人问题与系统生成的讲解示例;也利于教师或家长了解实际呈现效果与讲解风格。
面向学校与平台的集成能力
针对教育机构与学习平台,VideoTutor强调“可嵌入/可对接”的能力(如 API 或嵌入式工作流);适用于题库系统、在线课程平台或 LMS,将题目解析与可视化讲解以更低延迟接入既有产品。
💡 实用进阶技巧
🧩 给足题目信息:在提问中写清已知条件、变量与目标(如“已知 a>0,问极限值”),能显著提升生成脚本的准确度与讲解完整性。
🖼️ 善用截图:遇到含图形/表格/函数图的题,直接上传清晰截图;系统更容易抽取关键元素并生成相应动画。
🗣️ 指定语言与目标学段:如果支持可选项,明确“讲解语言/字幕/年级段”,让旁白风格与难度匹配受众。
🪜 分步追问:生成首段讲解后,继续就某一步骤或易错点发问,可触发更细的二次讲解与补充例题。
🧠 对照考纲关键词:在提示词中包含“SAT Official Practice: xxx”或“AP Calculus AB: xxx”等考纲词,有助于系统按考点组织内容。
💳 价格套餐与订阅方式
各版本价格与功能差异
| 方案 | 价格 | 核心功能 | 
|---|---|---|
| 个人使用(Beta) | 未公布 | 按题生成教学视频;多语音讲解;覆盖 K-12 与常见考点 | 
| 专业版 | 未公布 | 更高生成配额、高清导出、批量题目解析等(以官网公布为准) | 
| 教育机构/学校 | 定制/未公布 | 嵌入式集成与接口能力、面向题库/课程平台的对接支持 | 
订阅方式
目前官网未公开统一定价页面。建议先通过 官网 了解最新版本,并从登录入口(如 My Videos)创建/管理内容;如为学校或平台侧使用,建议通过官网渠道与团队联系以咨询集成与授权方案。
⚠️ 价格说明:当前处于 Beta 与快速迭代期,功能与计费可能随版本变动而调整;请以官网与官方公告为准。
❓VideoTutor 常见问题解答(FAQ)
Q1: 如何创建我的第一个讲解视频?
A: 在登录后输入你的问题(或贴上题干文本/上传清晰截图),提交后系统会自动生成脚本与动画并合成语音讲解。建议在问题中写明已知条件与目标结果,以获得更清晰的结构化讲解。
Q2: 是否支持从“截图题/拍照题”直接生成讲解?
A: 支持。系统会先识别图像中的题干与关键元素,再生成相匹配的可视化推导与语音旁白。拍照时注意保证题面清晰、无遮挡与端正。
Q3: 支持哪些语言?
A: 官网当前展示“8 Languages Supported”。底层所集成的语音引擎具备更广泛的多语言能力,但实际可用语种与声音样式以 VideoTutor 前端提供的选项为准。
Q4: 讲解视频能否下载或导出?
A: 截至目前,官网未公开统一的导出说明。若你有本地留存或教学使用需求,建议联系官方获取最新导出策略或通过机构合作开通相应权限。
Q5: 面向学校/平台是否提供 API 或嵌入集成?
A: 产品强调可对接的机构场景(如题库、LMS 等)。如需批量解析、题库接入或统一账号体系,建议通过官网渠道联系团队沟通集成细节与授权模式。
Q6: 数据与隐私如何保障?
A: 官方暂未发布独立隐私政策页面。一般建议:避免上传包含个人身份信息的图片/音视频;如用于校内系统集成,请与官方签署数据保护条款(DPA)并明确数据留存与删除流程。
Q7: VideoTutor 与“通用视频生成器”有何不同?
A: VideoTutor 是“教育场景优先”的视频生成:强调语义精准与数学/科学可视化,采用程序化动画(而非扩散式生成)来确保公式、图形与推导过程的准确与可读性,更适合题目讲解与考试备考。
Q8: 能否指定讲解难度或学段?
A: 可以。建议在问题中明确“学段/考试类型”(如 “AP Calculus AB” 或 “SAT Official Practice”),系统会据此安排讲解节奏与知识铺垫。
Q9: 生成不满意怎么办?
A: 你可以就某一步骤继续追问(例如“第 2 步为何如此变形?”),系统会触发补充讲解;也可以换一种表述方式重提问题,或补充约束条件以减少歧义。
Q10: 是否有移动端 App?
A: 目前以 Web 端为主。移动端形态与上架时间未有公开说明,建议关注官网更新或官方渠道公告。
相关导航


Synthesia

新Atlasf

Consensus

NotebookLM

