nicai_123@

帅气的我简直无法用语言描述!
unsloth

unsloth

Unsloth 是个特别为Llama和DeepSeek-R1等大语言模型设计的微调工具,能让速度提高2倍,内存减少70%。对那些想要提升模型性能的AI开发者和技术迷来说,这就是你寻找已久的神器!
2920
RAGFlow

RAGFlow

RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。
3290
snowai 应用

snowai 应用

一款多应用功能的 Ai生图,Ai 视频平台~
4300
VoiceCraft

VoiceCraft

VoiceCraft是一款新型语音模型,支持克隆语音和修改音频文本。
5060
CosyVoice

CosyVoice

FunAudioLLM 是阿里巴巴开发的一组语音处理模型,SenseVoice:语音识别模型 。CosyVoice:文本转语音模型,支持多语言并且可以复刻自己的声音。
5510
parler-tts

parler-tts

Parler-TTS 是一种轻量级的文本转语音 (TTS) 模型,可以生成具有给定说话者风格(性别、音调、说话风格等)的高质量、自然的语音。
2490
SnowAi

SnowAi

一款好用Ai生成式平台,支持deepseek-r1对话,多款免费应用、ppt生成、midjourney绘画等。
4650
edge-tts

edge-tts

微软开源文本转语音服务。
3070
ChatTTS

ChatTTS

开源的文本转语音工具。
2350
story-flicks

story-flicks

本项目可以输入一个故事主题,使用大语言模型生成故事视频,视频中包含大模型生成的图片、故事内容,以及音频和字幕信息。 项目后端技术栈为 python + fastapi 框架,前端为 react + antd + vite。
7430
FunClip

FunClip

FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。
3820
FunASR

FunASR

FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。
3510