nicai_123@

帅气的我简直无法用语言描述!
CosyVoice

CosyVoice

FunAudioLLM 是阿里巴巴开发的一组语音处理模型,SenseVoice:语音识别模型 。CosyVoice:文本转语音模型,支持多语言并且可以复刻自己的声音。
2020
parler-tts

parler-tts

Parler-TTS 是一种轻量级的文本转语音 (TTS) 模型,可以生成具有给定说话者风格(性别、音调、说话风格等)的高质量、自然的语音。
1540
SnowAi

SnowAi

一款好用Ai生成式平台,支持deepseek-r1对话,多款免费应用、ppt生成、midjourney绘画等。
3060
edge-tts

edge-tts

微软开源文本转语音服务。
1980
ChatTTS

ChatTTS

开源的文本转语音工具。
1620
story-flicks

story-flicks

本项目可以输入一个故事主题,使用大语言模型生成故事视频,视频中包含大模型生成的图片、故事内容,以及音频和字幕信息。 项目后端技术栈为 python + fastapi 框架,前端为 react + antd + vite。
5850
FunClip

FunClip

FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。
2150
FunASR

FunASR

FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。
2540
n8n

n8n

n8n 是一个工作流自动化平台,它为技术团队提供了代码的灵活性和无代码的速度。n8n 拥有 400 多个集成、原生 AI 功能和公平代码许可证,可让您构建强大的自动化功能,同时完全控制您的数据和部署。
2260
MediaCrawlerPro

MediaCrawlerPro

小红书爬虫,抖音爬虫, 快手爬虫, B站爬虫, 微博爬虫,百度贴吧,知乎爬虫
2910
Douyin_TikTok_Download_API

Douyin_TikTok_Download_API

开箱即用的高性能异步抖音、快手、TikTok、Bilibili数据爬取工具,支持API调用,在线批量解析及下载。
2000
MediaCrawler

MediaCrawler

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫
1950