<aside> 💡
생성한 음성의 음정을 화면에 그려 튜닝합니다.
</aside>
Pitch Tuning 은 음성합성 엔진에서 자연스러움을 표현하기 위해 가장 많은 시간과 노력을 들여야 하는 작업 중 하나입니다. 최근에는 Auto Pitch Tuning 기술이 발달하여, 사람이 일일이 조정하지 않아도 기계가 자동으로 음정을 잘 튜닝해줍니다. 하지만 자동 튜닝된 파라미터가 너무 최적화된 경우, 더 자연스러운 보컬을 만들기 위한 추가 작업이 막막할 수 있습니다.
기존 상용 음성합성 엔진들은 이렇게 튜닝된 Pitch 파라미터를 기반으로 음성을 생성하는 경우가 많습니다. 그러나 AINOW는 목소리를 생성할 때 Pitch 파라미터를 요구하지 않습니다. AINOW는 보컬 모델이 기존에 노래를 어떻게 불렀는지를 학습하여, 그에 맞춰 피치를 자동으로 결정합니다. 이로 인해 보컬의 스타일에 따라 Pitch 곡선이 달라지며, 노트의 분할만 잘 표현해도 추가적 Pitch Tuning이 필요 없을 정도로 자연스러운 목소리가 생성됩니다.
따라서 AINOW Vocal Editor에 그려지는 Pitch 곡선은 생성된 목소리를 분석한 결과를 바탕으로 표시되며, 자연스러움을 더하기보다는 특별한 기교를 더하거나, 끝음을 올리는 등 특정 효과를 넣는 데 주로 활용됩니다.
기존 음성합성엔진에서 Pitch Tuning 을 목소리에 자연스러움을 더하기 위해서 사용했다면 아이나우에서는 자연스러움 보다는 끝음을 올리거나 특별한 효과를 누기 위해서 사용하게 됩니다.
아래 영상은 Pitch Tuning 을 활용하는 예시를 보여줍니다.
위 피치 튜닝을 활용하기 위해서는 생성한 음에 대해서 Pitch 와 Mel 을 볼 수 있게 오른쪽 하단의 Control Panel 을 Tuning 으로 바꿉니다.
그러면 생성한 음성에 대해서 Pitch 곡선을 볼 수 있는데 여기에서 Shift + Alt 를 누르면 마우스 커서가 펜툴이 되면서 피치를 그릴 수 있는 형태가 됩니다. (펜툴이 아니더라도 Shift + Alt 를 누르고 마우스 드래그를 하면 피치가 그려집니다)
그렇게 피치를 그리고나서 오른쪽 Tuning Voice 버튼을 클릭하거나 Alt + T 를 누르면 그려진대로 피치가 적용 됩니다.
밴딩을 주기 위해서는 이 Pitch Tuning 보다는 노트의 분할 을 활용하는 것이 보통 더 자연스럽습니다. 하지만 이 Pitch Tuning 은 음성합성엔진의 꽃이며, 활용하는 사람에 따라 무궁무진한 가능성을 보여줄 수 있기 때문에 아이나우에서도 이 기능을 제공하게 되었습니다.