Files
onnx-voice-changer/README.md
T
2026-05-30 21:30:49 +07:00

32 lines
1.4 KiB
Markdown

# Standalone ONNX Voice Changer Service
Layanan pengubah suara real-time berbasis AI berlatensi rendah menggunakan akselerasi ONNX Runtime dan model RVC (Retrieval-based Voice Conversion).
## Struktur Proyek
- `server.py`: WebSocket server utama yang memproses streaming audio dan menyajikan static HTTP frontend.
- `frontend/`: File UI web client (HTML, CSS, JS).
- `lib/`: Modul inferensi ONNX RVC.
- `weights/`: Tempat penyimpanan model suara (folder per model berisi file `.onnx` dan opsional file `.pth`).
- `pretrained/`: Model pra-latih dasar (seperti `vec-768-layer-12.onnx`).
- `rmvpe.pt` & `rmvpe.py`: Untuk ekstraksi pitch suara fidelitas tinggi.
## Cara Menjalankan
### Persyaratan Sistem
Pastikan Python 3.10+ sudah terinstal di sistem Anda beserta library yang dibutuhkan di `requirements.txt`.
### Menjalankan Server
Jalankan server menggunakan Python dari environment Anda:
```bash
python server.py --host 127.0.0.1 --port 8765 --http_port 8000
```
Parameter opsional:
- `--host`: Alamat host WebSocket server (default: `127.0.0.1`).
- `--port`: Port WebSocket server (default: `8765`).
- `--http_port`: Port HTTP server untuk UI web client (default: `8000`).
- `--device`: Execution Provider (`cpu`, `cuda`, atau `dml` - default: `cuda`).
- `--model`: Nama folder model suara di dalam `weights/` yang ingin dimuat langsung saat start.
Setelah server berjalan, Web UI akan otomatis terbuka di browser Anda pada alamat `http://localhost:8000`.