Commit Graph

433 Commits

Author SHA1 Message Date
imeepos 03a87223de fix: 修复工作流结果获取逻辑
- 移除响应URL比较条件,总是尝试获取最终结果
- 优化GET请求逻辑,确保能正确获取工作流执行结果
- 解决响应URL相同时无法获取结果的问题

现在无论响应URL是否改变,都会尝试对响应URL进行GET请求来获取包含output_files的完整结果。
2025-08-04 15:06:18 +08:00
imeepos 07239ee53c feat: 完成自动表单生成功能并修复参数格式和验证逻辑
主要功能:
-  实现基于工作流规范的自动表单生成
-  支持 image 字段的文件上传和云存储
-  支持 value 字段的文本输入
-  正确的参数格式: 使用字段名而非节点ID作为键
-  修复验证逻辑: 只有 image 字段必填,value 字段可选
-  增加超时时间到10分钟,适应 ComfyUI 长时间处理
-  实现完整的工作流执行和结果获取流程

技术改进:
- 重构 ComfyUI 服务架构,区分基础设施层和业务层
- 优化错误处理和用户体验
- 添加详细的调试日志和状态跟踪
- 实现自动结果获取,支持异步工作流处理

测试覆盖:
- AutoFormGenerator 组件单元测试
- ComfyUIExecuteModal 集成测试
- 文件上传服务测试
2025-08-04 14:51:06 +08:00
imeepos aaabe7942c feat: add complete ComfyUI management system
- Add ComfyUI management page with workflow execution capabilities
- Add configuration modal for ComfyUI API settings
- Add workflow execution modal with real-time progress tracking
- Add workflow publishing modal for sharing workflows
- Add ComfyUI service layer for API communication
- Add comprehensive TypeScript type definitions
- Update navigation to include ComfyUI management
- Update Cargo.toml with required dependencies

Features:
- Real-time workflow execution with WebSocket progress updates
- Configurable API settings (URL, timeout, retry, concurrency)
- Workflow publishing with metadata management
- Error handling and validation
- Responsive UI design consistent with existing app
2025-08-04 10:42:15 +08:00
imeepos dccbb7cda6 fix: resolve TypeScript error in ComfyUIConfigModal handleInputChange function
- Updated handleInputChange function signature to accept undefined values
- Fixes 'Argument of type number | undefined is not assignable' error on line 248
- Allows proper handling of optional numeric fields in ComfyuiConfig interface
2025-08-04 10:41:07 +08:00
imeepos 42ae580034 feat: 实现ComfyUI API服务集成
- 添加ComfyUI API数据模型 (comfyui.rs)
- 实现HTTP客户端服务层 (comfyui_service.rs)
- 创建Tauri命令层 (comfyui_commands.rs)
- 集成服务到应用状态管理
- 注册所有API命令到Tauri处理器
- 添加urlencoding依赖
- 支持8个API端点的完整功能

API端点包括:
- 工作流管理 (获取/发布/删除)
- 工作流执行和规范查询
- 服务器状态监控
- 文件列表管理
- 连接测试和配置管理

遵循四层架构模式: 数据模型  基础设施服务  表示命令  应用状态集成
2025-08-04 10:23:48 +08:00
imeepos fee8909b20 refactor: 移除 HedraLipSyncModal 中未使用的 useEffect 导入
- 清理不必要的 React hooks 导入
- 优化代码结构
2025-08-01 18:44:36 +08:00
imeepos 46c3ea6501 feat: 实现 Hedra 口型合成异步化改造
- 将 Hedra 口型合成任务改为异步处理模式
- 添加完整的数据模型和仓储层支持
- 实现后台任务轮询和实时进度通知
- 创建 HedraLipSyncRecords 页面显示任务列表
- 将原有功能封装为 Modal 组件
- 支持多任务并发处理和状态跟踪
- 添加事件驱动的前端状态更新机制

主要变更:
- 新增 HedraLipSyncRecord 数据模型
- 新增 HedraLipSyncRepository 仓储层
- 新增 HedraLipSyncModal 组件
- 新增 HedraLipSyncRecords 页面
- 修改 bowong_text_video_agent_commands 支持异步处理
- 添加事件总线支持 Hedra 任务进度通知
- 更新路由配置和工具列表
2025-08-01 18:40:54 +08:00
imeepos 8dcde192a4 fix: resolve TaskStatus type error and update Hedra lip sync components
- Fix TypeScript error in bowongTextVideoAgentService.ts by using TaskStatus enum values instead of string literals
- Update Hedra lip sync tool components and types
- Remove integration tests and add SimpleHedraLipSyncTool component
- Clean up unused test files and update tool configurations
2025-08-01 15:58:05 +08:00
imeepos 5fdf3c5a4b refactor: 重构 Hedra 文件上传方式,使用文件路径而非文件内容传输
- 修改 HedraFileUploadRequest 使用 file_path 而不是 file_data
- 添加 HedraFileUploadApiRequest 用于后端到 API 的请求
- 更新后端服务读取文件并转换为 API 请求格式
- 重构前端文件选择,使用 @tauri-apps/api/dialog 直接选择文件路径
- 移除复杂的文件转换和临时文件创建逻辑
- 简化文件上传流程,避免大文件在前后端间传输

这种方式更适合 Tauri 架构,避免了大文件传输的性能问题
2025-08-01 11:21:12 +08:00
imeepos 538254ee38 fix: 修复 Hedra 口型合成工具的 API 调用问题
- 修复前端和后端参数类型不匹配问题
- 在前端服务中添加 fileToBytes 方法,将 File 对象转换为字节数组
- 更新后端 HedraFileUploadRequest 结构,添加 purpose 字段
- 修复 Tauri 命令参数接收方式,使用 params 而不是 request
- 将 bowong_wait_for_task_completion 的模拟实现替换为真实的 API 调用
- 使用 wait_for_task_completion 方法实现真实的任务等待逻辑

现在 Hedra 工具应该能够正确调用后端 API 进行文件上传和任务处理
2025-08-01 11:13:25 +08:00
imeepos 0ec73f03ca feat: 添加 Hedra 口型合成工具
- 新增 HedraLipSyncTool React 组件,支持图片和音频文件上传
- 添加 hedraLipSync.ts 类型定义文件
- 在 tools.ts 中注册新工具配置
- 在 App.tsx 中添加路由配置
- 在后端添加 Hedra 相关的 Tauri 命令:
  - hedra_upload_file: 文件上传功能
  - hedra_submit_task: 任务提交功能
  - hedra_query_task_status: 任务状态查询功能
- 为 BowongTextVideoAgentService 添加 Clone trait 支持
- 修复异步函数中 MutexGuard 跨 await 点的问题
- 临时禁用有问题的测试文件以确保编译成功

完整实现了从文件上传到任务监控的完整工作流程
2025-08-01 11:04:45 +08:00
imeepos ef1c8f03b9 fix: 修复 AppState 中缺失的 bowong_text_video_agent_service 字段
- 在 new_with_database 测试构造函数中添加缺失的 bowong_text_video_agent_service 字段
- 确保所有 AppState 构造函数都包含完整的字段初始化
- 解决编译错误:missing field bowong_text_video_agent_service in initializer
2025-08-01 10:43:16 +08:00
imeepos 548148e56a 重构ComfyUI集成架构:明确区分云端Modal和本地ComfyUI两种生成模式
- 函数重命名以提高可读性:
  - execute_comfyui_generation  execute_modal_cloud_generation
  - perform_outfit_image_generation  perform_local_comfyui_generation

- 更新生成类型标识:
  - 云端Modal模式:generation_type = 'modal_cloud'
  - 本地ComfyUI模式:generation_type = 'local_comfyui'

- 前端UI优化:
  - 将切换开关改为单选按钮组样式
  - 更新描述文本,明确两种模式的区别
  - Gallery中显示单选按钮样式的生成类型标签

- 架构清晰化:
  - 云端Modal模式:使用云端MidJourney API
  - 本地ComfyUI模式:使用用户配置的本地ComfyUI服务
  - 完全分离两种生成逻辑,避免混淆

- 修复类型推断错误,确保编译通过
2025-07-31 19:54:34 +08:00
imeepos c0994149d5 fix: 修改openapi.json 2025-07-31 18:46:49 +08:00
imeepos 55bd1be96a remove unuse 2025-07-31 18:10:57 +08:00
imeepos 31892c1640 feat: 更新声音克隆工具路由配置
- 将 /tools/voice-clone 路由从 VoiceCloneTool 改为 VoiceGenerationHistory
- 统一声音克隆和语音生成功能入口
- VoiceGenerationHistory 页面已集成 VoiceCloneModal 和 SpeechGenerationModal
- 提供更好的用户体验和功能整合
2025-07-31 18:10:38 +08:00
imeepos 2f463507b8 feat: 实现图片格式转换和实时事件通知功能
- 添加多种图片格式支持(WebP, BMP, TIFF, GIF等)
- 实现自动格式转换功能,将不支持的格式转换为JPG
- 使用Tauri事件系统替代定时轮询,实现任务状态实时更新
- 优化批量处理性能和用户体验
- 修复前端状态不实时更新的问题

主要变更:
1. 后端添加image crate依赖和格式转换逻辑
2. 前端添加事件监听机制,移除定时轮询
3. 实现进度回调和实时状态通知
4. 支持更多图片格式的批量处理
2025-07-31 18:02:09 +08:00
imeepos d9d1c4df52 refactor: 清理语音选择器相关组件
- 删除未使用的VoiceSelectorDemo组件
- 移除各组件中的冗余导入和未使用代码
- 优化VoiceCloneModal、VoiceSelector、SystemVoiceSelector组件
- 清理ModelDetail和VoiceCloneTool页面中的无用代码

影响范围: 语音克隆功能模块
类型: 代码清理和重构
2025-07-31 16:43:43 +08:00
imeepos b2c6aac3e9 fix: 修复SpeechGenerationModal中emotion字段的TypeScript类型错误
- 为emotion字段添加类型断言,确保e.target.value符合SpeechGenerationRequest接口的emotion联合类型要求
- 解决了'string'类型无法分配给emotion联合类型的编译错误
2025-07-31 16:42:34 +08:00
imeepos f246850cb9 fix: 修复后端API密钥默认值问题
- 修改ImageEditingConfig默认实现中的api_key为默认值
- 解决后端检查API密钥时报告'API密钥未设置'的问题
- 确保前后端API密钥配置一致性

现在后端服务初始化时会使用默认API密钥,
避免用户在使用图像编辑功能时遇到API密钥未设置错误
2025-07-31 16:26:17 +08:00
imeepos 95cfa7dd7b feat: 修改AI生成水印默认设置为不勾选
- 修改前端DEFAULT_IMAGE_EDITING_PARAMS中watermark默认值为false
- 修改后端ImageEditingParams默认实现中watermark为false
- 修改后端ImageEditingRequest默认实现中watermark为false
- 修改图像编辑服务中watermark的fallback默认值为false

现在用户在使用图像编辑工具时,AI生成水印选项默认不勾选,
用户可以根据需要手动勾选启用水印功能
2025-07-31 16:17:31 +08:00
imeepos 534add9424 fix: 修复图像编辑工具演示模式,启用真实API调用
- 修复加载任务列表功能,启用get_all_image_editing_tasks和get_all_batch_editing_tasks API调用
- 修复API密钥设置功能,启用set_image_editing_api_key API调用
- 修复单张图片编辑功能,启用edit_single_image API调用,移除模拟代码
- 修复批量图片编辑功能,启用edit_batch_images API调用,移除模拟进度代码
- 移除所有TODO注释和演示模式提示文字
- 清理setTimeout、setInterval等模拟代码
- 保持错误处理和UI状态管理逻辑

图像编辑工具现已从演示模式转换为完全功能的生产版本
2025-07-31 16:13:29 +08:00
imeepos 20c7a2100e 修复批量任务记录ID冲突问题 - 实施方案1
问题分析:
- 批量生成时创建了2个不同的记录,但执行时通过model_id+model_image_id查找
- 由于2个任务使用相同的model_id和model_image_id,find()总是返回第一个记录
- 导致两个任务都操作同一个记录ID,进度更新相互覆盖

解决方案:
- 在OutfitImageGenerationRequest中添加record_id字段
- 任务执行时直接传递记录ID,避免查找错误
- 保持向后兼容,支持旧的查找逻辑

修改内容:
- 后端:添加record_id字段到OutfitImageGenerationRequest结构
- 前端:更新TypeScript类型定义
- 执行逻辑:在execute_outfit_image_task中传递记录ID
- 核心逻辑:修改perform_outfit_image_generation使用传入的record_id

这样确保每个任务精确操作自己对应的记录,彻底解决记录ID冲突问题。
2025-07-31 15:54:39 +08:00
imeepos 72fbdbbd66 在前端穿搭图片生成记录页面显示 ComfyUI 任务ID
- 在 OutfitPhotoGenerationHistory 组件的记录列表中显示 comfyui_prompt_id
- 在详情模态框中添加 ComfyUI 任务ID 字段显示
- 在 OutfitImageGallery 组件的网格视图和列表视图中显示任务ID
- 使用 font-mono 和背景色突出显示任务ID,便于识别和调试
- 为批量任务进度更新问题的调试提供可视化支持
2025-07-31 15:45:25 +08:00
imeepos 833cb0d987 修复数据库迁移版本冲突,成功添加 comfyui_prompt_id 字段
- 修复迁移版本号冲突:将 ComfyUI prompt_id 字段迁移从 v28 改为 v29
- 在 Cargo.toml 中添加 default-run 配置,解决 Tauri 开发命令的二进制文件选择问题
- 添加数据库检查工具 check_db.rs 用于调试数据库结构
- 成功应用迁移 v29,outfit_image_records 表现在包含 comfyui_prompt_id 字段
- 为解决批量任务进度更新错乱问题奠定基础
2025-07-31 15:41:15 +08:00
杨明明 59c7cb47ad Merge branch 'master' of gitee.com:meepo_vip/mixvideo 2025-07-31 15:31:38 +08:00
imeepos 676effdab4 fix: 修复数据库迁移问题
- 将表创建和索引创建逻辑从仓储初始化方法移到迁移系统
- 移除 outfit_image_repository.rs 中的 init_tables 表创建逻辑
- 确保所有数据库结构变更通过迁移系统统一管理
- 修复 comfyui_prompt_id 索引创建时机问题

这样可以避免在旧数据库上创建索引时找不到字段的错误。
2025-07-31 15:31:17 +08:00
杨明明 05d9709420 feat: 添加图像编辑工具
- 基于火山云SeedEdit 3.0 API的智能图像编辑工具
- 支持单张图片编辑和批量处理功能
- 提供丰富的预设提示词和参数配置
- 实现任务管理和进度监控
- 集成到便捷工具系统

功能特性:
- 单张图片编辑:选择图片、输入提示词、实时编辑
- 批量处理:文件夹批量处理、进度监控、结果统计
- 参数配置:引导强度、随机种子、水印设置等
- 预设提示词:风格转换、场景变换、色彩调整、特效处理
- 任务管理:状态监控、历史记录、清理功能

技术实现:
- Rust后端:图像编辑服务、API调用、错误处理
- React前端:响应式界面、实时更新、用户体验优化
- 类型安全:完整的TypeScript类型定义
- 模块化设计:可扩展的架构和组件复用
2025-07-31 15:28:29 +08:00
imeepos 4b20f69560 fix: 修复批量任务状态更新错乱问题
- 添加 comfyui_prompt_id 字段到 OutfitImageRecord 和 OutfitPhotoGeneration 模型
- 创建数据库迁移添加 prompt_id 字段和索引
- 修改 ComfyUI 服务添加基于 prompt_id 的工作流执行方法
- 更新仓储层添加根据 prompt_id 查找记录的方法
- 修改任务执行逻辑保存 ComfyUI prompt_id 到数据库
- 创建基于 prompt_id 的进度回调函数替代基于索引的回调
- 修改批量处理逻辑使用精确的 ID 匹配而非数组索引
- 标记旧的基于索引的批量方法为已弃用

解决了当选择2个商品1个模特时,任务完成后更新错误任务状态的问题。
现在通过 ComfyUI 的 prompt_id 建立精确的任务映射关系。
2025-07-31 15:24:48 +08:00
imeepos ff5cccfb05 merge: 合并video-generation-feature分支到master
合并内容:
- 视频生成功能完整实现
- 火山云API集成和自动下载上传
- 视频预览组件和下载功能
- ComfyUI JSON替换优化
- 换装图片生成功能改进

解决冲突:
- App.tsx路由配置合并
- 保留语音生成历史和语音克隆功能
- 新增火山云视频生成工具路由

新增功能:
- 视频生成任务管理
- 视频预览和下载
- 自动CDN上传
- 防盗链处理
- 批量操作支持
2025-07-31 14:34:59 +08:00
imeepos 582d5c2709 feat: 优化换装图片生成功能
更新内容:
- 优化model_repository.rs中的数据库操作
- 改进outfit_image_commands.rs中的命令处理逻辑
- 完善outfitImageService.ts中的前端服务接口

技术改进:
- 提升数据库查询性能
- 增强错误处理机制
- 优化前后端数据交互

用户体验:
- 更稳定的换装图片生成流程
- 更好的错误提示和处理
- 更流畅的操作体验
2025-07-31 14:33:16 +08:00
imeepos b158546738 refactor: 移除ComfyUI JSON替换中的image字段处理
优化内容:
- 移除模特图片和商品图片节点中image字段的替换逻辑
- 移除不必要的filename提取逻辑
- 简化替换流程,只处理image_url字段

技术改进:
- 减少不必要的字段替换操作
- 避免image和image_url字段的潜在冲突
- 简化工作流节点替换逻辑

影响范围:
- ComfyUI工作流JSON替换更加精准
- 调试文件生成更加简洁
- 减少潜在的字段冲突问题
2025-07-31 14:22:50 +08:00
imeepos 7b4a9fb7c9 fix: 修复ComfyUI JSON替换中image字段的值类型问题
问题修复:
- image字段的值从字符串字面量改为Value::String类型
- 确保image和image_url字段二选一的逻辑正确

技术细节:
- 模特图片替换: image字段设置为空字符串,使用image_url
- 商品图片替换: image字段设置为空字符串,使用image_url
- 修复了Value类型不匹配的编译错误

影响范围:
- ComfyUI工作流JSON替换逻辑
- 调试文件生成的正确性
- 图片节点参数的正确传递
2025-07-31 14:21:13 +08:00
杨明明 f025f1daf8 feat: 添加语音生成历史页面的下载到指定目录和批量下载功能
后端新增功能:
� download_audio_to_directory - 下载单个音频文件到指定目录
� batch_download_audio_to_directory - 批量下载音频文件到指定目录
� 智能文件名生成,基于文本内容和记录ID
�️ 文件名安全处理,移除非法字符

前端新增功能:
� 批量选择模式,支持选择多个已完成的记录
� 全选/取消全选功能
� 下载到指定目录(使用文件夹选择对话框)
 快速下载(原浏览器下载方式)
� 批量下载进度显示和状态管理

用户体验改进:
 双重下载选项:快速下载 + 指定目录下载
 批量操作界面,支持选择和批量下载
 智能文件命名,包含文本内容片段
 完整的错误处理和用户反馈
 响应式UI设计,适配不同操作模式

技术实现:
- 使用Tauri的文件夹选择API
- 异步批量下载处理
- 状态管理和UI交互优化
- 类型安全的TypeScript实现
2025-07-31 14:08:59 +08:00
imeepos 6c43e6f08b feat: 实现视频生成完成后自动下载并上传到云端服务
新增功能:
1. 视频生成完成后自动下载到本地临时文件
2. 自动上传到云端S3服务
3. 将S3 URL转换为CDN HTTPS地址
4. 支持防盗链绕过的视频下载
5. 完善的错误处理和fallback机制

技术实现:
- download_and_upload_video(): 主要流程控制
- download_video_to_file(): 下载视频到本地临时文件
- 使用CloudUploadService上传到S3
- convert_s3_to_cdn_url(): S3到CDN URL转换
- 临时文件自动清理机制

用户体验:
- 视频生成完成后自动获得可访问的CDN链接
- 无需手动下载和上传操作
- 支持原始URL作为fallback保证可用性
- 详细的日志记录便于问题排查

安全特性:
- 防盗链绕过HTTP头设置
- 临时文件安全清理
- 错误情况下的资源释放
- 超时控制防止长时间阻塞
2025-07-31 14:03:51 +08:00
杨明明 afb7ff538d fix: 修复语音生成历史页面播放和下载按钮不显示问题
问题根源:
- 使用了错误的枚举值 SpeechGenerationRecordStatus.Completed(首字母大写)
- 正确的枚举值应该是 SpeechGenerationRecordStatus.COMPLETED(全大写)

修复内容:
� 修正播放/暂停按钮的状态判断条件
� 修正下载按钮的状态判断条件
� 修正状态筛选选项的枚举值
� 移除调试代码,保持代码整洁

现在已完成状态的语音记录应该能正确显示播放和下载按钮了!

技术细节:
- 枚举定义:SpeechGenerationRecordStatus.COMPLETED = 'completed'
- 条件判断:record.status === SpeechGenerationRecordStatus.COMPLETED
- 状态标准化:确保从数据库读取的字符串正确映射到枚举值
2025-07-31 14:02:23 +08:00
杨明明 4d1d118148 debug: 添加语音生成历史页面音频信息调试
添加详细的调试信息来诊断音频播放和下载功能问题:

� 调试功能:
- 打印原始记录数据和音频URL信息
- 统计音频文件的存在情况
- 在UI中显示每条记录的音频状态
- 追踪播放/下载按钮的显示条件

� 调试信息包括:
- 记录状态和类型
- audio_url 和 local_file_path 的存在情况
- 按钮显示逻辑的判断结果
- 音频统计信息

这将帮助定位为什么已完成的记录看不到音频信息和无法下载的问题。
2025-07-31 13:55:39 +08:00
imeepos d4b9e77020 fix: 修复isLoadingProxy状态未使用的问题
问题修复:
- isLoadingProxy状态被定义但在UI中未使用
- 代理加载过程缺乏用户反馈
- 加载状态管理逻辑不够清晰

改进内容:
1. UI显示优化:
   - 在加载动画中区分普通加载和代理加载
   - 显示'正在获取视频流...'提示代理加载状态
   - 代理加载时隐藏悬浮按钮避免误操作

2. 状态管理优化:
   - 简化初始加载逻辑,移除不必要的try-catch
   - 在视频错误时正确切换加载状态
   - 代理加载开始时停止普通加载状态

3. 用户体验改进:
   - 明确区分两种加载状态的视觉反馈
   - 提供更详细的加载进度信息
   - 避免在代理加载时显示操作按钮

技术细节:
- 加载条件: (isLoading || isLoadingProxy)
- 按钮显示条件: !isLoading && !isLoadingProxy && !error
- 状态切换: setIsLoading(false)  setIsLoadingProxy(true)
- 错误处理: 代理失败时正确清理所有加载状态
2025-07-31 13:55:00 +08:00
杨明明 4f133f3fbe fix: 修复语音生成历史页面状态映射问题
问题分析:
- 语音合成弹框使用前端UI状态枚举(SpeechGenerationStatus)
- 语音生成历史页面使用数据库记录状态枚举(SpeechGenerationRecordStatus)
- 后端保存的状态值与前端枚举值不匹配导致状态显示错误

修复内容:
� 新增 normalizeStatus 函数确保状态类型安全转换
� 添加详细的调试日志追踪状态值传递过程
� 完善状态样式和图标处理,支持所有状态类型
� 在记录加载时标准化状态值,确保前后端一致性
� 优化状态筛选逻辑,使用标准化状态进行比较

技术改进:
- 类型安全的状态转换函数
- 完整的状态枚举值处理
- 详细的错误日志和调试信息
- 向后兼容的状态值处理

现在语音生成历史页面应该能正确显示记录状态!
2025-07-31 13:50:48 +08:00
imeepos d3713e54c7 feat: 实现防盗链绕过机制解决403错误
问题分析:
- 火山云CDN配置了防盗链保护,直接访问返回403 Forbidden
- 需要特定的Referer和User-Agent头部才能正常访问
- 跨域访问限制导致浏览器无法直接播放视频

解决方案:
1. 添加crossOrigin='anonymous'属性到video标签
2. 创建代理服务绕过防盗链限制
3. 实现fallback机制:直接访问失败时自动使用代理

技术实现:
- 新增get_video_stream_base64命令,返回Base64编码的视频数据
- 添加完整的HTTP头部模拟真实浏览器请求
- 包含Referer、Origin、User-Agent等关键头部信息
- 实现自动fallback:直接播放失败时转为代理模式

用户体验:
- 透明的错误处理,用户无感知切换
- 保持原有的播放控制功能
- 支持大文件的Base64编码传输
- 提供详细的错误日志便于调试

HTTP头部配置:
- User-Agent: 模拟Chrome浏览器
- Referer: https://www.volcengine.com/
- Origin: https://www.volcengine.com
- Accept: 视频MIME类型
- Sec-Fetch-*: 安全策略头部
2025-07-31 13:49:25 +08:00
imeepos fb8b5b90ee refactor: 优化video标签使用source子元素
技术改进:
- 将video标签的src属性改为使用source子元素
- 明确指定video/mp4 MIME类型
- 添加浏览器不支持时的fallback文本

优势:
- 更好的浏览器兼容性
- 支持多种视频格式的fallback
- 更符合HTML5标准的最佳实践
- 便于后续扩展支持多种视频格式

代码结构:
- 保持原有的事件处理和样式
- 条件渲染source元素,避免空URL
- 添加用户友好的错误提示文本
2025-07-31 13:44:36 +08:00
imeepos 12714f1c53 refactor: 优化视频预览弹框UI设计
界面优化:
- 将操作按钮改为悬浮在视频右上角的圆形按钮
- 移除底部冗余的操作按钮区域,界面更简洁
- 添加悬停效果和颜色区分:绿色下载、蓝色外链、紫色全屏

用户体验改进:
- 悬浮按钮仅在鼠标悬停时完全显示,不遮挡视频内容
- 下载按钮显示加载动画,提供视觉反馈
- 按钮添加缩放和阴影效果,提升交互体验
- 使用backdrop-blur实现毛玻璃效果

技术实现:
- 使用CSS group-hover实现悬停显示逻辑
- 添加z-index确保按钮层级正确
- 优化transition动画,提供流畅的交互体验
- 移除底部控制栏中重复的全屏按钮

视觉设计:
- 圆形按钮设计更现代化
- 半透明背景不影响视频观看
- 颜色编码帮助用户快速识别功能
- 响应式hover效果提升用户体验
2025-07-31 13:43:33 +08:00
imeepos e954fe2814 feat: 实现火山云视频预览和下载功能
新增功能:
- 创建VideoPreviewModal组件,支持视频播放控制
- 实现视频预览功能,包括播放/暂停、静音、进度控制
- 添加视频下载功能,支持用户选择保存位置
- 集成到VideoGenerationTool中,替换原有的简单链接预览

技术实现:
- 新增download_video_to_directory Tauri命令,支持文件选择对话框
- 使用Modal组件作为基础,确保一致的用户体验
- 实现完整的视频播放控制界面,包括进度条、音量控制
- 支持全屏播放和外部链接打开
- 添加错误处理和加载状态管理

用户体验改进:
- 点击预览按钮打开专业的视频播放器界面
- 点击下载按钮可选择保存位置和文件名
- 播放控制包括快进/快退、静音等常用功能
- 响应式设计,适配不同屏幕尺寸
- 统一的通知系统反馈操作结果

代码优化:
- 移除未使用的导入和变量
- 规范化错误处理和状态管理
- 遵循项目的TypeScript和React最佳实践
2025-07-31 13:39:46 +08:00
杨明明 ef0d19d144 fix: 修复音色选择器数据源,使用真实系统音色数据
主要修复:
- 替换VoiceSelector中的假数据为真实系统音色数据
- 使用SystemVoiceService.getAllSystemVoices()获取系统音色
- 修复VoiceInfo.description类型兼容性问题(string[] -> string)
- 根据音色类型和性别自动生成标签
- 并行加载系统音色和自定义音色,提升性能

技术改进:
� 集成SystemVoiceService获取真实数据
�️ 智能标签生成(系统/精品/童声等)
� 类型安全的数据转换
 并行数据加载优化
� 详细的加载日志输出

现在音色选择器将显示真实的系统音色数据,而不是模拟数据!
2025-07-31 13:36:20 +08:00
杨明明 efc3fb9d82 feat: 优化音色选择器,提升用户体验
主要改进:
- 新增 VoiceSelector 组件 - 统一的音色选择器弹框
- 优化 SpeechGenerationModal - 简化音色选择流程
- 新增 VoiceSelectorDemo - 演示新音色选择器功能

功能特性:
� 统一展示系统音色和自定义音色
� 支持搜索和分类筛选(类型、性别)
� 音色预览试听功能(预留接口)
� 响应式网格布局
 收藏常用音色功能
�️ 音色标签和描述展示
� 美观的卡片式设计

用户体验改进:
 主界面简化为单个选择按钮
 无需在音色类型间手动切换
 更直观的音色信息展示
 节省界面空间,提升操作效率
 统一的交互体验
2025-07-31 13:33:44 +08:00
imeepos a8f720eba2 refactor: 优化火山云视频生成界面 - 移除无用字段
界面优化:
- 移除【配置】列:火山云API没有配置选项,显示无意义
- 移除【任务描述】字段:对视频生成任务来说不必要

具体修改:
- 删除VideoGenerationRecord接口中的description字段
- 删除CreateVideoGenerationRequest接口中的description字段
- 移除表格头部的【配置】列
- 移除表格行中对应的配置信息单元格(分辨率、FPS、时长等)
- 移除创建表单中的【任务描述】输入框
- 移除列表显示中的描述文本
- 清理未使用的FileAudio图标导入

用户体验改进:
- 界面更简洁,专注于核心功能
- 减少不必要的输入字段
- 表格列数减少,信息更集中
- 符合火山云API的实际功能特性
2025-07-31 13:29:53 +08:00
imeepos 1a504fa4b0 fix: 修复任务状态同步问题 - 连续失败时标记任务为失败
问题修复:
- API查询失败时只打印警告,没有更新数据库状态
- 前端显示运行中,但后端日志显示连续失败
- 任务会一直轮询直到超时,用户体验差

技术实现:
- 添加连续失败计数器 (consecutive_failures)
- 连续失败3次后自动标记任务为失败状态
- 立即更新数据库记录,前端能及时看到失败状态
- 避免无意义的长时间轮询

修复逻辑:
- 成功时重置失败计数器
- 失败时增加计数器
- 达到上限时标记为失败并退出轮询
- 错误类型: API_CONSECUTIVE_FAILURES

用户体验改进:
- 快速反馈任务失败状态(30秒内)
- 避免长时间显示运行中的假象
- 明确的失败原因和错误代码
2025-07-31 13:17:55 +08:00
imeepos 65412e80b7 fix: 修复S3 URL转换问题 - 添加CDN URL转换功能
问题修复:
- 火山云API不支持S3协议URL (s3://...),需要HTTPS URL
- 云上传服务返回S3 URI格式,需要转换为可访问的CDN URL

技术实现:
- 添加convert_s3_to_cdn_url方法,将S3 URL转换为CDN URL
- 支持s3://ap-northeast-2/modal-media-cache/格式转换为https://cdn.roasmax.cn/
- 支持通用s3://格式和amazonaws.com格式的URL转换
- 在文件上传后立即转换URL格式,确保API调用使用正确的HTTPS URL

修复的错误:
- 400 Bad Request: unsupported protocol scheme 's3'
- 错误原因: 使用了S3协议URL而非HTTPS URL
- 解决方案: 自动转换S3 URL为可访问的CDN HTTPS URL

URL转换示例:
- s3://ap-northeast-2/modal-media-cache/upload/... -> https://cdn.roasmax.cn/upload/...
- 确保火山云API能够正确访问图片和视频文件
2025-07-31 13:11:08 +08:00
杨明明 10f3d93a19 feat: 升级声音克隆与TTS工具页面
- 将首页改为语音生成历史列表页面,支持搜索和筛选功能
- 创建VoiceCloneModal组件,将声音克隆功能封装为弹框
- 创建SpeechGenerationModal组件,将语音合成功能封装为弹框
- 更新路由配置,/tools/voice-clone指向新的历史页面
- 支持音频播放、下载、删除等操作
- 使用App.tsx中的modal-root容器渲染Modal组件

主要变更:
- 新增 VoiceGenerationHistory.tsx - 语音生成历史页面
- 新增 VoiceCloneModal.tsx - 声音克隆弹框组件
- 新增 SpeechGenerationModal.tsx - 语音合成弹框组件
- 修改 App.tsx - 更新路由配置
- 修改 VoiceCloneTool.tsx - 添加新的图标导入
2025-07-31 13:07:00 +08:00
imeepos 2d9e6f067d fix: 修复火山云API调用问题 - 添加文件上传到云端功能
问题修复:
- 火山云API需要HTTPS URL,不能使用本地文件路径
- 添加CloudUploadService集成,在调用API前先上传文件到云端
- 修复image_url和driving_video_url使用本地路径的问题

技术实现:
- 集成现有的CloudUploadService到VolcanoVideoService
- 在call_volcano_api方法中添加文件上传逻辑
- 先上传图片和驱动视频到云端,获取HTTPS URL
- 使用云端URL调用火山云API,确保API调用成功
- 添加详细的上传进度日志和错误处理

修复的错误:
- 400 Bad Request: image format unsupported: invalid image url
- 错误原因: 使用了本地文件路径 'c:\\Users\\...' 而非HTTPS URL
- 解决方案: 自动上传文件到云端并获取可访问的URL
2025-07-31 13:06:08 +08:00