imeepos
|
55bd1be96a
|
remove unuse
|
2025-07-31 18:10:57 +08:00 |
imeepos
|
31892c1640
|
feat: 更新声音克隆工具路由配置
- 将 /tools/voice-clone 路由从 VoiceCloneTool 改为 VoiceGenerationHistory
- 统一声音克隆和语音生成功能入口
- VoiceGenerationHistory 页面已集成 VoiceCloneModal 和 SpeechGenerationModal
- 提供更好的用户体验和功能整合
|
2025-07-31 18:10:38 +08:00 |
imeepos
|
2f463507b8
|
feat: 实现图片格式转换和实时事件通知功能
- 添加多种图片格式支持(WebP, BMP, TIFF, GIF等)
- 实现自动格式转换功能,将不支持的格式转换为JPG
- 使用Tauri事件系统替代定时轮询,实现任务状态实时更新
- 优化批量处理性能和用户体验
- 修复前端状态不实时更新的问题
主要变更:
1. 后端添加image crate依赖和格式转换逻辑
2. 前端添加事件监听机制,移除定时轮询
3. 实现进度回调和实时状态通知
4. 支持更多图片格式的批量处理
|
2025-07-31 18:02:09 +08:00 |
imeepos
|
d9d1c4df52
|
refactor: 清理语音选择器相关组件
- 删除未使用的VoiceSelectorDemo组件
- 移除各组件中的冗余导入和未使用代码
- 优化VoiceCloneModal、VoiceSelector、SystemVoiceSelector组件
- 清理ModelDetail和VoiceCloneTool页面中的无用代码
影响范围: 语音克隆功能模块
类型: 代码清理和重构
|
2025-07-31 16:43:43 +08:00 |
imeepos
|
b2c6aac3e9
|
fix: 修复SpeechGenerationModal中emotion字段的TypeScript类型错误
- 为emotion字段添加类型断言,确保e.target.value符合SpeechGenerationRequest接口的emotion联合类型要求
- 解决了'string'类型无法分配给emotion联合类型的编译错误
|
2025-07-31 16:42:34 +08:00 |
imeepos
|
f246850cb9
|
fix: 修复后端API密钥默认值问题
- 修改ImageEditingConfig默认实现中的api_key为默认值
- 解决后端检查API密钥时报告'API密钥未设置'的问题
- 确保前后端API密钥配置一致性
现在后端服务初始化时会使用默认API密钥,
避免用户在使用图像编辑功能时遇到API密钥未设置错误
|
2025-07-31 16:26:17 +08:00 |
imeepos
|
95cfa7dd7b
|
feat: 修改AI生成水印默认设置为不勾选
- 修改前端DEFAULT_IMAGE_EDITING_PARAMS中watermark默认值为false
- 修改后端ImageEditingParams默认实现中watermark为false
- 修改后端ImageEditingRequest默认实现中watermark为false
- 修改图像编辑服务中watermark的fallback默认值为false
现在用户在使用图像编辑工具时,AI生成水印选项默认不勾选,
用户可以根据需要手动勾选启用水印功能
|
2025-07-31 16:17:31 +08:00 |
imeepos
|
534add9424
|
fix: 修复图像编辑工具演示模式,启用真实API调用
- 修复加载任务列表功能,启用get_all_image_editing_tasks和get_all_batch_editing_tasks API调用
- 修复API密钥设置功能,启用set_image_editing_api_key API调用
- 修复单张图片编辑功能,启用edit_single_image API调用,移除模拟代码
- 修复批量图片编辑功能,启用edit_batch_images API调用,移除模拟进度代码
- 移除所有TODO注释和演示模式提示文字
- 清理setTimeout、setInterval等模拟代码
- 保持错误处理和UI状态管理逻辑
图像编辑工具现已从演示模式转换为完全功能的生产版本
|
2025-07-31 16:13:29 +08:00 |
imeepos
|
20c7a2100e
|
修复批量任务记录ID冲突问题 - 实施方案1
问题分析:
- 批量生成时创建了2个不同的记录,但执行时通过model_id+model_image_id查找
- 由于2个任务使用相同的model_id和model_image_id,find()总是返回第一个记录
- 导致两个任务都操作同一个记录ID,进度更新相互覆盖
解决方案:
- 在OutfitImageGenerationRequest中添加record_id字段
- 任务执行时直接传递记录ID,避免查找错误
- 保持向后兼容,支持旧的查找逻辑
修改内容:
- 后端:添加record_id字段到OutfitImageGenerationRequest结构
- 前端:更新TypeScript类型定义
- 执行逻辑:在execute_outfit_image_task中传递记录ID
- 核心逻辑:修改perform_outfit_image_generation使用传入的record_id
这样确保每个任务精确操作自己对应的记录,彻底解决记录ID冲突问题。
|
2025-07-31 15:54:39 +08:00 |
imeepos
|
72fbdbbd66
|
在前端穿搭图片生成记录页面显示 ComfyUI 任务ID
- 在 OutfitPhotoGenerationHistory 组件的记录列表中显示 comfyui_prompt_id
- 在详情模态框中添加 ComfyUI 任务ID 字段显示
- 在 OutfitImageGallery 组件的网格视图和列表视图中显示任务ID
- 使用 font-mono 和背景色突出显示任务ID,便于识别和调试
- 为批量任务进度更新问题的调试提供可视化支持
|
2025-07-31 15:45:25 +08:00 |
imeepos
|
833cb0d987
|
修复数据库迁移版本冲突,成功添加 comfyui_prompt_id 字段
- 修复迁移版本号冲突:将 ComfyUI prompt_id 字段迁移从 v28 改为 v29
- 在 Cargo.toml 中添加 default-run 配置,解决 Tauri 开发命令的二进制文件选择问题
- 添加数据库检查工具 check_db.rs 用于调试数据库结构
- 成功应用迁移 v29,outfit_image_records 表现在包含 comfyui_prompt_id 字段
- 为解决批量任务进度更新错乱问题奠定基础
|
2025-07-31 15:41:15 +08:00 |
杨明明
|
59c7cb47ad
|
Merge branch 'master' of gitee.com:meepo_vip/mixvideo
|
2025-07-31 15:31:38 +08:00 |
imeepos
|
676effdab4
|
fix: 修复数据库迁移问题
- 将表创建和索引创建逻辑从仓储初始化方法移到迁移系统
- 移除 outfit_image_repository.rs 中的 init_tables 表创建逻辑
- 确保所有数据库结构变更通过迁移系统统一管理
- 修复 comfyui_prompt_id 索引创建时机问题
这样可以避免在旧数据库上创建索引时找不到字段的错误。
|
2025-07-31 15:31:17 +08:00 |
杨明明
|
05d9709420
|
feat: 添加图像编辑工具
- 基于火山云SeedEdit 3.0 API的智能图像编辑工具
- 支持单张图片编辑和批量处理功能
- 提供丰富的预设提示词和参数配置
- 实现任务管理和进度监控
- 集成到便捷工具系统
功能特性:
- 单张图片编辑:选择图片、输入提示词、实时编辑
- 批量处理:文件夹批量处理、进度监控、结果统计
- 参数配置:引导强度、随机种子、水印设置等
- 预设提示词:风格转换、场景变换、色彩调整、特效处理
- 任务管理:状态监控、历史记录、清理功能
技术实现:
- Rust后端:图像编辑服务、API调用、错误处理
- React前端:响应式界面、实时更新、用户体验优化
- 类型安全:完整的TypeScript类型定义
- 模块化设计:可扩展的架构和组件复用
|
2025-07-31 15:28:29 +08:00 |
imeepos
|
4b20f69560
|
fix: 修复批量任务状态更新错乱问题
- 添加 comfyui_prompt_id 字段到 OutfitImageRecord 和 OutfitPhotoGeneration 模型
- 创建数据库迁移添加 prompt_id 字段和索引
- 修改 ComfyUI 服务添加基于 prompt_id 的工作流执行方法
- 更新仓储层添加根据 prompt_id 查找记录的方法
- 修改任务执行逻辑保存 ComfyUI prompt_id 到数据库
- 创建基于 prompt_id 的进度回调函数替代基于索引的回调
- 修改批量处理逻辑使用精确的 ID 匹配而非数组索引
- 标记旧的基于索引的批量方法为已弃用
解决了当选择2个商品1个模特时,任务完成后更新错误任务状态的问题。
现在通过 ComfyUI 的 prompt_id 建立精确的任务映射关系。
|
2025-07-31 15:24:48 +08:00 |
imeepos
|
ff5cccfb05
|
merge: 合并video-generation-feature分支到master
合并内容:
- 视频生成功能完整实现
- 火山云API集成和自动下载上传
- 视频预览组件和下载功能
- ComfyUI JSON替换优化
- 换装图片生成功能改进
解决冲突:
- App.tsx路由配置合并
- 保留语音生成历史和语音克隆功能
- 新增火山云视频生成工具路由
新增功能:
- 视频生成任务管理
- 视频预览和下载
- 自动CDN上传
- 防盗链处理
- 批量操作支持
|
2025-07-31 14:34:59 +08:00 |
imeepos
|
582d5c2709
|
feat: 优化换装图片生成功能
更新内容:
- 优化model_repository.rs中的数据库操作
- 改进outfit_image_commands.rs中的命令处理逻辑
- 完善outfitImageService.ts中的前端服务接口
技术改进:
- 提升数据库查询性能
- 增强错误处理机制
- 优化前后端数据交互
用户体验:
- 更稳定的换装图片生成流程
- 更好的错误提示和处理
- 更流畅的操作体验
|
2025-07-31 14:33:16 +08:00 |
imeepos
|
b158546738
|
refactor: 移除ComfyUI JSON替换中的image字段处理
优化内容:
- 移除模特图片和商品图片节点中image字段的替换逻辑
- 移除不必要的filename提取逻辑
- 简化替换流程,只处理image_url字段
技术改进:
- 减少不必要的字段替换操作
- 避免image和image_url字段的潜在冲突
- 简化工作流节点替换逻辑
影响范围:
- ComfyUI工作流JSON替换更加精准
- 调试文件生成更加简洁
- 减少潜在的字段冲突问题
|
2025-07-31 14:22:50 +08:00 |
imeepos
|
7b4a9fb7c9
|
fix: 修复ComfyUI JSON替换中image字段的值类型问题
问题修复:
- image字段的值从字符串字面量改为Value::String类型
- 确保image和image_url字段二选一的逻辑正确
技术细节:
- 模特图片替换: image字段设置为空字符串,使用image_url
- 商品图片替换: image字段设置为空字符串,使用image_url
- 修复了Value类型不匹配的编译错误
影响范围:
- ComfyUI工作流JSON替换逻辑
- 调试文件生成的正确性
- 图片节点参数的正确传递
|
2025-07-31 14:21:13 +08:00 |
杨明明
|
f025f1daf8
|
feat: 添加语音生成历史页面的下载到指定目录和批量下载功能
后端新增功能:
� download_audio_to_directory - 下载单个音频文件到指定目录
� batch_download_audio_to_directory - 批量下载音频文件到指定目录
� 智能文件名生成,基于文本内容和记录ID
�️ 文件名安全处理,移除非法字符
前端新增功能:
� 批量选择模式,支持选择多个已完成的记录
� 全选/取消全选功能
� 下载到指定目录(使用文件夹选择对话框)
⚡ 快速下载(原浏览器下载方式)
� 批量下载进度显示和状态管理
用户体验改进:
✅ 双重下载选项:快速下载 + 指定目录下载
✅ 批量操作界面,支持选择和批量下载
✅ 智能文件命名,包含文本内容片段
✅ 完整的错误处理和用户反馈
✅ 响应式UI设计,适配不同操作模式
技术实现:
- 使用Tauri的文件夹选择API
- 异步批量下载处理
- 状态管理和UI交互优化
- 类型安全的TypeScript实现
|
2025-07-31 14:08:59 +08:00 |
imeepos
|
6c43e6f08b
|
feat: 实现视频生成完成后自动下载并上传到云端服务
新增功能:
1. 视频生成完成后自动下载到本地临时文件
2. 自动上传到云端S3服务
3. 将S3 URL转换为CDN HTTPS地址
4. 支持防盗链绕过的视频下载
5. 完善的错误处理和fallback机制
技术实现:
- download_and_upload_video(): 主要流程控制
- download_video_to_file(): 下载视频到本地临时文件
- 使用CloudUploadService上传到S3
- convert_s3_to_cdn_url(): S3到CDN URL转换
- 临时文件自动清理机制
用户体验:
- 视频生成完成后自动获得可访问的CDN链接
- 无需手动下载和上传操作
- 支持原始URL作为fallback保证可用性
- 详细的日志记录便于问题排查
安全特性:
- 防盗链绕过HTTP头设置
- 临时文件安全清理
- 错误情况下的资源释放
- 超时控制防止长时间阻塞
|
2025-07-31 14:03:51 +08:00 |
杨明明
|
afb7ff538d
|
fix: 修复语音生成历史页面播放和下载按钮不显示问题
问题根源:
- 使用了错误的枚举值 SpeechGenerationRecordStatus.Completed(首字母大写)
- 正确的枚举值应该是 SpeechGenerationRecordStatus.COMPLETED(全大写)
修复内容:
� 修正播放/暂停按钮的状态判断条件
� 修正下载按钮的状态判断条件
� 修正状态筛选选项的枚举值
� 移除调试代码,保持代码整洁
现在已完成状态的语音记录应该能正确显示播放和下载按钮了!
技术细节:
- 枚举定义:SpeechGenerationRecordStatus.COMPLETED = 'completed'
- 条件判断:record.status === SpeechGenerationRecordStatus.COMPLETED
- 状态标准化:确保从数据库读取的字符串正确映射到枚举值
|
2025-07-31 14:02:23 +08:00 |
杨明明
|
4d1d118148
|
debug: 添加语音生成历史页面音频信息调试
添加详细的调试信息来诊断音频播放和下载功能问题:
� 调试功能:
- 打印原始记录数据和音频URL信息
- 统计音频文件的存在情况
- 在UI中显示每条记录的音频状态
- 追踪播放/下载按钮的显示条件
� 调试信息包括:
- 记录状态和类型
- audio_url 和 local_file_path 的存在情况
- 按钮显示逻辑的判断结果
- 音频统计信息
这将帮助定位为什么已完成的记录看不到音频信息和无法下载的问题。
|
2025-07-31 13:55:39 +08:00 |
imeepos
|
d4b9e77020
|
fix: 修复isLoadingProxy状态未使用的问题
问题修复:
- isLoadingProxy状态被定义但在UI中未使用
- 代理加载过程缺乏用户反馈
- 加载状态管理逻辑不够清晰
改进内容:
1. UI显示优化:
- 在加载动画中区分普通加载和代理加载
- 显示'正在获取视频流...'提示代理加载状态
- 代理加载时隐藏悬浮按钮避免误操作
2. 状态管理优化:
- 简化初始加载逻辑,移除不必要的try-catch
- 在视频错误时正确切换加载状态
- 代理加载开始时停止普通加载状态
3. 用户体验改进:
- 明确区分两种加载状态的视觉反馈
- 提供更详细的加载进度信息
- 避免在代理加载时显示操作按钮
技术细节:
- 加载条件: (isLoading || isLoadingProxy)
- 按钮显示条件: !isLoading && !isLoadingProxy && !error
- 状态切换: setIsLoading(false) setIsLoadingProxy(true)
- 错误处理: 代理失败时正确清理所有加载状态
|
2025-07-31 13:55:00 +08:00 |
杨明明
|
4f133f3fbe
|
fix: 修复语音生成历史页面状态映射问题
问题分析:
- 语音合成弹框使用前端UI状态枚举(SpeechGenerationStatus)
- 语音生成历史页面使用数据库记录状态枚举(SpeechGenerationRecordStatus)
- 后端保存的状态值与前端枚举值不匹配导致状态显示错误
修复内容:
� 新增 normalizeStatus 函数确保状态类型安全转换
� 添加详细的调试日志追踪状态值传递过程
� 完善状态样式和图标处理,支持所有状态类型
� 在记录加载时标准化状态值,确保前后端一致性
� 优化状态筛选逻辑,使用标准化状态进行比较
技术改进:
- 类型安全的状态转换函数
- 完整的状态枚举值处理
- 详细的错误日志和调试信息
- 向后兼容的状态值处理
现在语音生成历史页面应该能正确显示记录状态!
|
2025-07-31 13:50:48 +08:00 |
imeepos
|
d3713e54c7
|
feat: 实现防盗链绕过机制解决403错误
问题分析:
- 火山云CDN配置了防盗链保护,直接访问返回403 Forbidden
- 需要特定的Referer和User-Agent头部才能正常访问
- 跨域访问限制导致浏览器无法直接播放视频
解决方案:
1. 添加crossOrigin='anonymous'属性到video标签
2. 创建代理服务绕过防盗链限制
3. 实现fallback机制:直接访问失败时自动使用代理
技术实现:
- 新增get_video_stream_base64命令,返回Base64编码的视频数据
- 添加完整的HTTP头部模拟真实浏览器请求
- 包含Referer、Origin、User-Agent等关键头部信息
- 实现自动fallback:直接播放失败时转为代理模式
用户体验:
- 透明的错误处理,用户无感知切换
- 保持原有的播放控制功能
- 支持大文件的Base64编码传输
- 提供详细的错误日志便于调试
HTTP头部配置:
- User-Agent: 模拟Chrome浏览器
- Referer: https://www.volcengine.com/
- Origin: https://www.volcengine.com
- Accept: 视频MIME类型
- Sec-Fetch-*: 安全策略头部
|
2025-07-31 13:49:25 +08:00 |
imeepos
|
fb8b5b90ee
|
refactor: 优化video标签使用source子元素
技术改进:
- 将video标签的src属性改为使用source子元素
- 明确指定video/mp4 MIME类型
- 添加浏览器不支持时的fallback文本
优势:
- 更好的浏览器兼容性
- 支持多种视频格式的fallback
- 更符合HTML5标准的最佳实践
- 便于后续扩展支持多种视频格式
代码结构:
- 保持原有的事件处理和样式
- 条件渲染source元素,避免空URL
- 添加用户友好的错误提示文本
|
2025-07-31 13:44:36 +08:00 |
imeepos
|
12714f1c53
|
refactor: 优化视频预览弹框UI设计
界面优化:
- 将操作按钮改为悬浮在视频右上角的圆形按钮
- 移除底部冗余的操作按钮区域,界面更简洁
- 添加悬停效果和颜色区分:绿色下载、蓝色外链、紫色全屏
用户体验改进:
- 悬浮按钮仅在鼠标悬停时完全显示,不遮挡视频内容
- 下载按钮显示加载动画,提供视觉反馈
- 按钮添加缩放和阴影效果,提升交互体验
- 使用backdrop-blur实现毛玻璃效果
技术实现:
- 使用CSS group-hover实现悬停显示逻辑
- 添加z-index确保按钮层级正确
- 优化transition动画,提供流畅的交互体验
- 移除底部控制栏中重复的全屏按钮
视觉设计:
- 圆形按钮设计更现代化
- 半透明背景不影响视频观看
- 颜色编码帮助用户快速识别功能
- 响应式hover效果提升用户体验
|
2025-07-31 13:43:33 +08:00 |
imeepos
|
e954fe2814
|
feat: 实现火山云视频预览和下载功能
新增功能:
- 创建VideoPreviewModal组件,支持视频播放控制
- 实现视频预览功能,包括播放/暂停、静音、进度控制
- 添加视频下载功能,支持用户选择保存位置
- 集成到VideoGenerationTool中,替换原有的简单链接预览
技术实现:
- 新增download_video_to_directory Tauri命令,支持文件选择对话框
- 使用Modal组件作为基础,确保一致的用户体验
- 实现完整的视频播放控制界面,包括进度条、音量控制
- 支持全屏播放和外部链接打开
- 添加错误处理和加载状态管理
用户体验改进:
- 点击预览按钮打开专业的视频播放器界面
- 点击下载按钮可选择保存位置和文件名
- 播放控制包括快进/快退、静音等常用功能
- 响应式设计,适配不同屏幕尺寸
- 统一的通知系统反馈操作结果
代码优化:
- 移除未使用的导入和变量
- 规范化错误处理和状态管理
- 遵循项目的TypeScript和React最佳实践
|
2025-07-31 13:39:46 +08:00 |
杨明明
|
ef0d19d144
|
fix: 修复音色选择器数据源,使用真实系统音色数据
主要修复:
- 替换VoiceSelector中的假数据为真实系统音色数据
- 使用SystemVoiceService.getAllSystemVoices()获取系统音色
- 修复VoiceInfo.description类型兼容性问题(string[] -> string)
- 根据音色类型和性别自动生成标签
- 并行加载系统音色和自定义音色,提升性能
技术改进:
� 集成SystemVoiceService获取真实数据
�️ 智能标签生成(系统/精品/童声等)
� 类型安全的数据转换
⚡ 并行数据加载优化
� 详细的加载日志输出
现在音色选择器将显示真实的系统音色数据,而不是模拟数据!
|
2025-07-31 13:36:20 +08:00 |
杨明明
|
efc3fb9d82
|
feat: 优化音色选择器,提升用户体验
主要改进:
- 新增 VoiceSelector 组件 - 统一的音色选择器弹框
- 优化 SpeechGenerationModal - 简化音色选择流程
- 新增 VoiceSelectorDemo - 演示新音色选择器功能
功能特性:
� 统一展示系统音色和自定义音色
� 支持搜索和分类筛选(类型、性别)
� 音色预览试听功能(预留接口)
� 响应式网格布局
⭐ 收藏常用音色功能
�️ 音色标签和描述展示
� 美观的卡片式设计
用户体验改进:
✅ 主界面简化为单个选择按钮
✅ 无需在音色类型间手动切换
✅ 更直观的音色信息展示
✅ 节省界面空间,提升操作效率
✅ 统一的交互体验
|
2025-07-31 13:33:44 +08:00 |
imeepos
|
a8f720eba2
|
refactor: 优化火山云视频生成界面 - 移除无用字段
界面优化:
- 移除【配置】列:火山云API没有配置选项,显示无意义
- 移除【任务描述】字段:对视频生成任务来说不必要
具体修改:
- 删除VideoGenerationRecord接口中的description字段
- 删除CreateVideoGenerationRequest接口中的description字段
- 移除表格头部的【配置】列
- 移除表格行中对应的配置信息单元格(分辨率、FPS、时长等)
- 移除创建表单中的【任务描述】输入框
- 移除列表显示中的描述文本
- 清理未使用的FileAudio图标导入
用户体验改进:
- 界面更简洁,专注于核心功能
- 减少不必要的输入字段
- 表格列数减少,信息更集中
- 符合火山云API的实际功能特性
|
2025-07-31 13:29:53 +08:00 |
imeepos
|
1a504fa4b0
|
fix: 修复任务状态同步问题 - 连续失败时标记任务为失败
问题修复:
- API查询失败时只打印警告,没有更新数据库状态
- 前端显示运行中,但后端日志显示连续失败
- 任务会一直轮询直到超时,用户体验差
技术实现:
- 添加连续失败计数器 (consecutive_failures)
- 连续失败3次后自动标记任务为失败状态
- 立即更新数据库记录,前端能及时看到失败状态
- 避免无意义的长时间轮询
修复逻辑:
- 成功时重置失败计数器
- 失败时增加计数器
- 达到上限时标记为失败并退出轮询
- 错误类型: API_CONSECUTIVE_FAILURES
用户体验改进:
- 快速反馈任务失败状态(30秒内)
- 避免长时间显示运行中的假象
- 明确的失败原因和错误代码
|
2025-07-31 13:17:55 +08:00 |
imeepos
|
65412e80b7
|
fix: 修复S3 URL转换问题 - 添加CDN URL转换功能
问题修复:
- 火山云API不支持S3协议URL (s3://...),需要HTTPS URL
- 云上传服务返回S3 URI格式,需要转换为可访问的CDN URL
技术实现:
- 添加convert_s3_to_cdn_url方法,将S3 URL转换为CDN URL
- 支持s3://ap-northeast-2/modal-media-cache/格式转换为https://cdn.roasmax.cn/
- 支持通用s3://格式和amazonaws.com格式的URL转换
- 在文件上传后立即转换URL格式,确保API调用使用正确的HTTPS URL
修复的错误:
- 400 Bad Request: unsupported protocol scheme 's3'
- 错误原因: 使用了S3协议URL而非HTTPS URL
- 解决方案: 自动转换S3 URL为可访问的CDN HTTPS URL
URL转换示例:
- s3://ap-northeast-2/modal-media-cache/upload/... -> https://cdn.roasmax.cn/upload/...
- 确保火山云API能够正确访问图片和视频文件
|
2025-07-31 13:11:08 +08:00 |
杨明明
|
10f3d93a19
|
feat: 升级声音克隆与TTS工具页面
- 将首页改为语音生成历史列表页面,支持搜索和筛选功能
- 创建VoiceCloneModal组件,将声音克隆功能封装为弹框
- 创建SpeechGenerationModal组件,将语音合成功能封装为弹框
- 更新路由配置,/tools/voice-clone指向新的历史页面
- 支持音频播放、下载、删除等操作
- 使用App.tsx中的modal-root容器渲染Modal组件
主要变更:
- 新增 VoiceGenerationHistory.tsx - 语音生成历史页面
- 新增 VoiceCloneModal.tsx - 声音克隆弹框组件
- 新增 SpeechGenerationModal.tsx - 语音合成弹框组件
- 修改 App.tsx - 更新路由配置
- 修改 VoiceCloneTool.tsx - 添加新的图标导入
|
2025-07-31 13:07:00 +08:00 |
imeepos
|
2d9e6f067d
|
fix: 修复火山云API调用问题 - 添加文件上传到云端功能
问题修复:
- 火山云API需要HTTPS URL,不能使用本地文件路径
- 添加CloudUploadService集成,在调用API前先上传文件到云端
- 修复image_url和driving_video_url使用本地路径的问题
技术实现:
- 集成现有的CloudUploadService到VolcanoVideoService
- 在call_volcano_api方法中添加文件上传逻辑
- 先上传图片和驱动视频到云端,获取HTTPS URL
- 使用云端URL调用火山云API,确保API调用成功
- 添加详细的上传进度日志和错误处理
修复的错误:
- 400 Bad Request: image format unsupported: invalid image url
- 错误原因: 使用了本地文件路径 'c:\\Users\\...' 而非HTTPS URL
- 解决方案: 自动上传文件到云端并获取可访问的URL
|
2025-07-31 13:06:08 +08:00 |
imeepos
|
09b79d55df
|
feat: 完善火山云API签名算法实现
- 添加完整的HMAC-SHA256签名算法
- 实现规范请求(CanonicalRequest)构建
- 实现待签名字符串(StringToSign)创建
- 实现签名密钥派生(kSigning)算法
- 实现最终签名计算和Authorization头构建
- 添加必要的依赖: hmac, sha2, hex, chrono, url
- 严格按照火山云API文档规范实现签名流程
技术细节:
- 支持POST请求的JSON body哈希计算
- 规范化查询字符串和请求头处理
- 多层HMAC密钥派生: kDate -> kRegion -> kService -> kSigning
- 使用cn-north-1地区和cv服务标识符
- 生成标准格式的Authorization请求头
|
2025-07-31 12:49:40 +08:00 |
imeepos
|
73149f4101
|
feat: 实现火山云视频生成功能
- 添加火山云视频生成服务,支持单图+驱动视频生成
- 实现VideoGenerationRecord数据模型和仓储层
- 创建数据库迁移文件支持视频生成记录
- 添加Tauri命令用于前后端通信
- 实现VideoGenerationTool前端界面
- 根据火山云API文档移除不支持的参数
- 支持图片和驱动视频文件上传
- 实现任务状态跟踪和进度显示
- 集成到工具页面路由和配置中
技术要点:
- 使用火山云realman_avatar_imitator_v2v_gen_video服务
- 支持API参数: req_key, image_url, driving_video_info
- 实现异步任务处理和状态轮询
- 遵循项目前端标准(lucide-react, TailwindCSS)
- 数据库索引优化查询性能
|
2025-07-31 12:43:30 +08:00 |
imeepos
|
6d4bf9150c
|
fix: 修复系统音色列表显示问题 - 修复枚举序列化格式不匹配和CSS类名问题
|
2025-07-31 11:14:24 +08:00 |
imeepos
|
fcc0b64488
|
feat: 添加系统音色管理功能和修复穿搭生成问题
- 新增系统音色管理模块
- 创建 SystemVoice 数据模型,支持多种音色类型和性别分类
- 添加系统音色数据库表和迁移文件,内置46个预设音色
- 实现 SystemVoiceRepository 仓库层,支持分页、搜索、分类查询
- 添加系统音色 Tauri 命令,提供完整的 API 接口
- 修复穿搭图片生成问题
- 修复 prompt 替换逻辑,避免错误覆盖模特描述节点
- 实现商品编号调试文件命名,支持 debug_replaced_1.json 等格式
- 添加 product_index 字段支持,便于多商品生成调试
- 修复编译错误,确保所有结构体字段完整
- 完善穿搭生成功能
- 添加分页加载功能,支持下拉加载更多记录
- 实现失败重试机制,提供用户友好的错误处理
- 支持多商品并发生成,每个商品独立任务处理
- 添加详细的测试验证文档
内置音色包括:
- 基础系统音色:青涩青年、精英青年、霸道青年等
- 精品音色:所有基础音色的 beta 版本
- 童声音色:聪明男童、可爱男童、萌萌女童等
- 角色音色:病娇弟弟、俊朗男友、甜心小玲等
- 节日音色:Santa Claus、Grinch、Rudolph
- 英文音色:Arnold、Charming Lady、Sweet Girl等
|
2025-07-31 10:54:19 +08:00 |
imeepos
|
5e92c47835
|
refactor: 清理调试日志和优化代码
- 移除outfit_image_commands.rs中的调试println语句
- 移除outfitImageService.ts中的调试console.log语句
- 优化outfit_image_repository.rs代码结构
- 改进connection_pool.rs连接管理
提升代码质量,减少不必要的日志输出。
|
2025-07-30 23:40:27 +08:00 |
imeepos
|
68c0ff9469
|
fix: 修复穿搭图片生成进度条显示问题
问题分析:
- 后台任务正常执行并发送进度事件,但前端进度条显示为'等待中'
- 前端只监听完成和失败事件,缺少进度事件监听
- 后台任务开始时没有更新记录状态为'生成中'
- 进度回调只发送前端事件,没有更新数据库记录
解决方案:
1. 前端添加outfit_generation_progress事件监听
2. 后台任务开始时立即更新记录状态为'生成中'
3. 进度回调同时更新数据库记录和发送前端事件
4. 修复WorkflowProgress事件数据结构
技术改进:
- 实时进度更新:数据库记录progress字段实时更新
- 完整事件监听:监听progress、completed、failed三种事件
- 状态同步:确保前端显示与后台任务状态一致
- 详细进度信息:包含当前步骤、总步数、状态消息等
现在前端能正确显示'生成中'状态和实时进度百分比。
|
2025-07-30 23:35:20 +08:00 |
imeepos
|
dd289a8685
|
fix: 修复穿搭图片生成结果重复问题 - 添加随机种子支持
问题分析:
- 每次生成的穿搭图片都完全相同
- 原因是ComfyUI工作流中的seed(随机种子)值固定不变
解决方案:
- 在ComfyUI工作流节点替换逻辑中添加seed随机化处理
- 支持BOWONG-INPUT-SEED/RANDOM节点的自动随机化
- 为所有KSampler和KSamplerAdvanced节点自动生成随机seed
- 添加rand依赖用于生成随机数
技术改进:
- 每次生成时自动生成0到2^32-1范围内的随机种子
- 支持多种seed节点命名方式
- 保持向后兼容,不影响现有工作流结构
- 添加详细日志记录随机种子值
现在每次生成都会产生不同的结果,提升用户体验。
|
2025-07-30 23:25:47 +08:00 |
imeepos
|
a477999445
|
feat: 实现穿搭图片生成异步后台任务模式
- 新增 execute_outfit_image_task 命令用于后台异步执行生成任务
- 修改前端流程:点击生成按钮后立即关闭弹框,任务在后台执行
- 添加 Tauri 事件系统支持实时进度更新和完成通知
- 前端服务层新增 createOutfitImageTask 和 executeOutfitImageTask 方法
- 支持任务状态实时更新:等待中 -> 生成中 -> 已完成/失败
- 保持向后兼容:原有同步 generateOutfitImages 方法仍可用
- 优化用户体验:无需等待生成完成即可继续操作其他功能
技术改进:
- 使用 tokio::spawn 实现真正的后台任务执行
- 通过 Tauri 事件系统实现前后端实时通信
- 复用现有生成逻辑,确保功能一致性
- 修复编译错误:正确的数据库导入路径和方法调用
|
2025-07-30 23:20:16 +08:00 |
imeepos
|
406c95f6c1
|
完善图片预览功能:添加左右切换和批量下载
- 修复图片点击事件被覆盖层阻挡的问题
- 添加图片左右切换功能,支持键盘方向键
- 添加批量下载所有图片功能
- 在工具栏显示当前图片位置(如 1/4)
- 支持键盘快捷键:ESC关闭、切换、+/-缩放、R旋转
- 优化图片容器样式,确保图片完整显示
|
2025-07-30 22:52:59 +08:00 |
imeepos
|
8b913b11a5
|
添加图片预览点击事件调试日志
- 在OutfitImageGallery中为图片点击事件添加详细日志
- 在ImagePreviewModal中添加渲染状态日志
- 帮助调试图片预览功能无响应的问题
|
2025-07-30 22:44:28 +08:00 |
imeepos
|
973ccf940a
|
修复穿搭图片预览功能
- 修复OutfitImageStatus枚举序列化问题,添加serde rename_all lowercase
- 修改ImagePreviewModal使用Portal渲染到modal-root容器
- 解决图片预览弹框无法显示的问题
- 确保状态正确显示为已完成而不是未知
|
2025-07-30 22:38:30 +08:00 |
imeepos
|
49ce97af90
|
修复穿搭图片生成前端显示问题
- 在生成成功时创建OutfitImage记录到数据库
- 修复get_records_by_model_id函数加载关联数据
- 解决前端状态显示'未知'和图片不显示的问题
- 添加必要的导入和错误处理
|
2025-07-30 22:32:06 +08:00 |
imeepos
|
cf672e474b
|
fix: 修复S3地址转换和穿搭图片生成任务状态同步
- 统一S3到CDN的URL转换逻辑,使用cdn.roasmax.cn域名
- 添加穿搭图片生成任务的完整状态同步:
* 开始处理时更新为Processing状态
* 失败时更新为Failed状态并记录错误信息
* 成功时更新为Completed状态并保存生成的图片URL
- 确保生成的S3 URL正确转换为可访问的CDN地址
- 改进错误处理,所有失败情况都会正确更新数据库状态
这些修改解决了穿搭图片生成记录状态不同步的问题,确保前端
能够正确显示任务进度和结果。
|
2025-07-30 22:26:38 +08:00 |
imeepos
|
8499fa1927
|
fix: 修复ComfyUI图片下载404错误
- 增强history API日志,显示详细的图片信息(文件名、子文件夹、类型)
- 智能解析ComfyUI返回的文件路径,支持subfolder信息
- 实现多路径尝试下载机制,优先使用API提供的确切路径
- 改进WebSocket进度跟踪,使用动态节点计数和智能完成检测
- 修复空节点错误判断逻辑,正确处理ComfyUI的成功响应
这些修改解决了ComfyUI生成图片后无法下载的问题,确保图片能够
成功从ComfyUI服务器下载并上传到云端存储。
|
2025-07-30 22:17:24 +08:00 |