diff --git a/README.md b/README.md index 807c9f4..4ac9922 100644 --- a/README.md +++ b/README.md @@ -163,3 +163,9 @@ To achieve low latency without output artifacts, the audio processing utilizes: 1. **Sliding Window Context Buffer:** Keeps a short historical buffer of the audio to feed the model the required context frames while minimizing output audio delay. 2. **Convolution Padding Fadeout:** 120ms of trailing silent padding is temporarily appended to input segments to avoid edge-fading anomalies inherent to RVC convolutional steps. 3. **Linear Resampling:** Low-overhead linear interpolation for quick sample rate adaptation. + +--- + +## 🤝 Credits & Acknowledgements +* **Made with ❤️ by [Kanara Technology](https://github.com/kanaratech)** +* Powered by [ONNX Runtime](https://onnxruntime.ai/) and [Retrieval-based Voice Conversion (RVC)](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI) diff --git a/docs/README.es.md b/docs/README.es.md index 1c64574..b43a3e9 100644 --- a/docs/README.es.md +++ b/docs/README.es.md @@ -163,3 +163,9 @@ Para lograr una latencia baja sin artefactos de salida, el procesamiento de audi 1. **Búfer de Contexto de Ventana Deslizante:** Mantiene un búfer histórico corto de audio para alimentar al modelo con los fragmentos de contexto necesarios, minimizando el retraso de la salida de audio. 2. **Desvanecimiento por Relleno de Convolución:** Se añade temporalmente un relleno silencioso de 120 ms al final de los segmentos de entrada para evitar anomalías de desvanecimiento en los bordes, inherentes a los pasos de convolución RVC. 3. **Remuestreo Lineal:** Interpolación lineal de bajo costo computacional para una rápida adaptación de la frecuencia de muestreo. + +--- + +## 🤝 Créditos y Agradecimientos +* **Hecho con ❤️ por [Kanara Technology](https://github.com/kanaratech)** +* Impulsado por [ONNX Runtime](https://onnxruntime.ai/) y [Retrieval-based Voice Conversion (RVC)](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI) diff --git a/docs/README.id.md b/docs/README.id.md index a448bc3..4169ead 100644 --- a/docs/README.id.md +++ b/docs/README.id.md @@ -163,3 +163,9 @@ Untuk mencapai latensi rendah tanpa artifak output, pemrosesan audio menggunakan 1. **Buffer Konteks Sliding Window:** Mempertahankan buffer historis pendek dari audio untuk memberikan frame konteks yang diperlukan ke model sambil meminimalkan penundaan audio output. 2. **Fadeout Padding Konvolusi:** Padding senyap trailing sebesar 120ms ditambahkan sementara ke segmen input untuk menghindari anomali memudar di tepi yang melekat pada langkah konvolusional RVC. 3. **Resampling Linear:** Penggunaan overhead rendah resampling linear untuk adaptasi laju sampel yang cepat. + +--- + +## 🤝 Kredit & Penghargaan +* **Dibuat dengan ❤️ oleh [Kanara Technology](https://github.com/kanaratech)** +* Ditenagai oleh [ONNX Runtime](https://onnxruntime.ai/) dan [Retrieval-based Voice Conversion (RVC)](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI) diff --git a/docs/README.ja.md b/docs/README.ja.md index 9f4351f..d0d9053 100644 --- a/docs/README.ja.md +++ b/docs/README.ja.md @@ -163,3 +163,9 @@ python server.py --host 127.0.0.1 --port 8765 --device cuda 1. **スライディングウィンドウコンテキストバッファ:** 出力オーディオの遅延を最小限に抑えながら、モデルに必要なコンテキストフレームを供給するために、オーディオの短い履歴バッファを保持します。 2. **畳み込みパディングフェードアウト:** RVCの畳み込みステップに固有のエッジフェード異常を回避するために、120msの末尾の無音パディングが入力セグメントに一時的に追加されます。 3. **線形リサンプリング:** 素早いサンプリングレート適応のための低オーバーヘッドの線形補間。 + +--- + +## 🤝 クレジットと謝辞 +* **[Kanara Technology](https://github.com/kanaratech) により ❤️ を込めて制作されました** +* [ONNX Runtime](https://onnxruntime.ai/) および [Retrieval-based Voice Conversion (RVC)](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI) を使用しています diff --git a/docs/README.zh.md b/docs/README.zh.md index f503805..66839cc 100644 --- a/docs/README.zh.md +++ b/docs/README.zh.md @@ -163,3 +163,9 @@ python server.py --host 127.0.0.1 --port 8765 --device cuda 1. **滑动窗口上下文缓冲区:** 保持较短的音频历史缓冲区,以向模型提供所需的上下文帧,同时最小化输出音频延迟。 2. **卷积填充淡出:** 在输入片段中临时追加 120ms 的尾随静音填充,以避免 RVC 卷积步骤中固有的边缘淡入淡出异常。 3. **线性重采样:** 低开销的线性插值,可快速适应采样率。 + +--- + +## 🤝 鸣谢与贡献 +* **由 [Kanara Technology](https://github.com/kanaratech) 用 ❤️ 制作** +* 基于 [ONNX Runtime](https://onnxruntime.ai/) 和 [Retrieval-based Voice Conversion (RVC)](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI)