Parallel Inference

<aside> 💡

한 번에 8개의 음성을 생성하여 선택할 수 있는 Parallel Inference 기능을 소개합니다.

</aside>

아이나우는 생성형 AI를 활용하여 목소리를 만드는 음성합성엔진이기 때문에 생성되는 목소리가 매번 다릅니다. 따라서 마음에 들지 않게 부르거나 약간의 손상이 들린다면 Style 을 변화 시키지 않아도 다시 생성할 때 조금씩 다르게 만들어냅니다.

다음 예시는 다음과 같이 설정한 Style 로 계속 생성한 결과를 보여줍니다.

C5 에서도 비브라토(바이브레이션)를 잘하지만 약하게 부르는 vsrse_soft1 : 76
C5 에서는 비브라토를 잘 하지 못하지만 강하게 부르는 chorus_power1 : 24

Interval_Inference.mp4

영상에서 보이듯, 생성된 음성의 강도는 비슷해 보이지만 비브라토 여부는 랜덤하게 결정됩니다. 비브라토가 필요하지만 계속 생성되지 않는 경우 아이나우에서의 비브라토 설정 을 참고하세요.

Parallel Inference의 활용

비브라토와 같은 세부적인 음성 표현은 보컬의 특성을 살려 자연스럽게 구현하는 것이 중요하기 때문에 원하는 음성을 얻으려면 생성 작업을 반복해야 할 수 있습니다.

Parallel Inference는 이러한 반복 과정을 간소화하여, 한 번의 클릭으로 8개의 결과를 생성하고 그중에서 선택할 수 있게 도와줍니다. 오른쪽 보컬 패널에서 Select Voice 버튼을 누르게 되면 아래와 같이 현재 생성한 mel 을 볼 수 있게 됩니다.

여기에서 왼쪽 하단에 Parallel Inference 를 체크하게 되면 그 후부터 Alt + W 로 목소리를 생성하게 될 때 8개가 한꺼번에 생성되고, 그 중에 하나가 랜덤하게 선택됩니다.