원격 동시통역에서의 오디오 압축

작성자 Dora Murgu | 2022년 8월 16일

이 기사를 Interprefied 팟캐스트에 업로드했으며 이제 선호하는 팟캐스트 디렉터리에서 이용할 수 있습니다.

아래에서 팟캐스트를 듣고 다운로드하세요:

다음에서 다운로드 가능:

음질은 하루 종일 우리와 함께하는 것입니다. 아침에 라디오를 켜는 것부터 밤늦게 새로운 TV 시리즈를 몰아보는 것까지, 좋은 오디오는 우리가 흔히 당연하게 여기는 것입니다. 보통 it's는 나쁜 오디오를 찾는 것이 비교적 쉽지만, 좋은 음질은 실제로 꽤 복잡한 문제입니다. 좋은 예로는 비닐 애호가와 다른 오디오 애호가들 사이에서 어느 포맷이 더 뛰어난 음질을 제공하는지에 대한 10년 전 논쟁이 있습니다: CD와 비닐.

원격 통역에서는 고품질 오디오를 수신하고 전송하는 것이 핵심입니다. 정보를 정확히 처리하고 사람'들의 청각을 보호하면서 즐거운 오디오 경험을 보장합니다.

오디오 우선 플랫폼으로서, we're 지속적으로 새로운 방법을 연구하고 있습니다 연설자 행동에 영향을 미치기, 또한 우수한 오디오 품질을 보장하는 혁신적인 오디오 솔루션을 구현하고 있습니다. 자주 논의되는 주제인 사운드 압축은 올바르게 적용될 경우 사운드 경험에 긍정적인 영향을 크게 줄 수 있습니다.

우리는 Richard Schiller, Interprefy의 오디오 엔지니어이자 수석 제품 매니저 사운드 압축이 무엇인지, RSI에서 어떻게 사용되는지, 그리고 사운드 품질에 어떤 영향을 미치는지 이해하기 위해.

안녕하세요 Richard님, 당신의 배경과 하는 일에 대해 조금 알려주세요.

안녕 도라, 다시 만나서 반가워요. 저는 Interprefy에서 시니어 제품 매니저 역할을 맡고 있습니다. 제품의 방향과 세부 사항을 관리합니다. 또한 저는 훈련된 사운드 엔지니어이기도 합니다. 원래 저는 world’의 가장 큰 방송 스피치 라디오 조직인 BBC World Service에서 일했습니다. 그 배경 때문에 저는 명확성과 일관성에 집착하게 됩니다.

일관성은 라디오를 대규모로 작동시키는 핵심이었으며, 명확성은 우리가 전달한 것의 본질이었습니다. 저는 음악 녹음 및 텔레비전 분야에서도 일한 경험이 있습니다. 저는 프로듀서, 감독, 진행자, 그리고 각본가 등 그 직업에서 대부분의 역할을 수행했습니다.

그렇다면 당신은 ’백만 달러짜리 질문에 답할 적임자입니다: 압축이란 무엇인가?

소리에서 압축이라고 불리는 두 가지 서로 다르고 관련 없는 것이 있습니다: 원래는 동적 압축이 있었으며, 이는 회로나 현재는 자동으로 사운드 레벨을 제어하는 알고리즘입니다. 이는 주로 동적 범위를 줄이는 데 사용되며 — 가장 부드러운 소리와 가장 큰 소리 사이의 범위입니다. 그 다음에 비트레이트 감소가 등장했으며, 이는 저장하거나 전송해야 하는 오디오 데이터 양을 줄이는 시스템입니다.

동적 압축과 비트레이트 감소는 잘 사용할 수도 있고, 나쁘게 사용할 수도 있습니다.

그렇다면, 그것들은 좋나요 아니면 나쁘나요?

아니요. 거의 모든 것과 마찬가지로, 이 두 기술은 잘 사용될 수도 있고 나쁘게 사용될 수도 있습니다. 나쁘게 사용한다면, 그렇다고 좋지 않은 것은 아니지만, 두 압축 형태 중 어느 하나가 본질적으로 나쁘다고 말하는 것은 없습니다.

다이내믹 컴프레션은 본질적으로 사운드 레벨을 감시하고 오디오가 너무 크게 들릴 때 볼륨 노브를 낮추는 장치를 갖는 것과 같습니다. 오디오가 조용해지면 다시 볼륨을 올립니다. 이는 사람들에게 크고 조용한 구간을 동일하게 잘 들을 수 있게 도와줍니다. 이는 볼륨을 낮추는 인간과 본질적으로 다르지 않으며 – 그리고 나는 다이내믹 컴프레션이 볼륨을 감소시키는 것에 관한 것이며, 따라서 그 이름이 붙여졌다고 강조합니다.

그렇다면, 압축에 대한 우려는 어디에서 오는가?

다이내믹 압축은 소리를 더 조용하게 만들며 이는 종종 바람직하지 않을 수 있습니다. 따라서 사전 설정된 볼륨 컨트롤을 통해 다시 크게 만들 수 있습니다. 압축은 신호의 레벨을 균등하게 만들기 때문에 두 가지 방법 중 하나를 선택할 수 있습니다. 더 조용하지만 듣기 쉬운 상태로 설정하거나, 더 크게 하고 주목을 끌게 할 수 있습니다. 여기서 잠시 논의를 떠나 중요한 점을 말씀드리자면; 소리가 너무 크게 들린다면 낮추세요. 항상 자신의 청취 레벨을 스스로 조절하세요.

그것은’는 단지 레벨이 잘못될 수 있는 것만이 아니라, 압축기의 시간 상수라고 불리는 것이 또한 중요합니다. 마지막으로 비율이 있습니다. 이것은 종종 너무 공격적으로 설정되어 그것은’는 압축이 말을 이해할 수 없게 만드는 가장 흔한 원인입니다.

가장 성가신 애플리케이션 중 하나는 오래된 소비자 장비와 일부 PC에서 사용되는 알고리즘 모두에 잘못 설계된 자동 이득 제어(AGC) 회로입니다. AGC와 노이즈 게이트는 노트북 및 기타 장치에서 기본적으로 켜져 있는 경우가 많습니다. 따라서 다이내믹스는 우리 생활에 언제나 존재합니다. 잘못 설정된 압축은 파열음과 치찰음(시빌런트)을 잘라내어 말하기를 이해하기 어렵게 만들 수 있습니다. 이는 특히 문장의 첫 번째 단어와 같이 단어 시작 부분의 강한 자음이 둔탁하게 들리는 현상으로 나타납니다. 잘못 설정된 AGC의 또 다른 징후는 누군가 큰 소리의 단어를 말한 뒤 조용한 단어를 말할 때, 조용한 단어의 끝은 들리지만 시작 부분을 듣기 힘든 경우입니다.

RSI로 넘어가 보자. 음악의 음질이 말의 음질과 어떻게 다른가?

거기에’는 많은 것이 공통적인’데, 각 경우마다 무엇이 좋은지 신중히 이해해야 합니다. 사람들은 음향 처리된 스튜디오에서 만든 클래식 음악 녹음의 수치를 가져와 말에 적용합니다. 어떤 면에서는 말이 오케스트라보다 쉽고, 어떤 면에서는’는 더 어렵습니다.

예를 들어, 대역폭의 상위 영역은 일부 악기만큼 말하기에 중요하지 않습니다. 일부 타악기에서는 대역폭이 가장 중요하고, 말하기에서는 부드러움이 우선되어야 한다는 좋은 주장이 있습니다. It’는 왜 녹음 엔지니어가 사람에게는 다른 마이크를 사용하고 스네어 드럼이나 심벌에는 다른 마이크를 사용하는지 설명합니다.

나는 일부 사람들이 18kHz와 20kHz 사이의 주파수가 말하기에 필수적이라고 소리칠 것이라는 것을 알고 있지만, 실제로는 그렇지 않다. 일반적으로, 음성 녹음 엔지니어가 사용하는 가장 최고이면서 가장 비싼 마이크는 그 주파수에 전혀 좋지 않다 aren’t 왜냐하면 그들은 그럴 필요가 없기 때문이다 don’t.

그리고 이것은 단순히 우연이 아닙니다. 당신이 숲 속에 있고 몇 미터 떨어진 사람의 입이 직접 귀에 향하고 있는 소리를 듣고 있다고 가정해 보세요(그리고 당신이 아직 20kHz까지 들을 수 있을 만큼 젊다고 가정합니다). 그런 다음 얼굴을 돌려 화자를 볼 수 있게 하고 그들이 옆으로 몸을 돌리면, 20kHz 성분을 더 이상 듣지 못하거나 최소한 크게 감소하게 됩니다. 이러한 매우 높은 주파수는 자연계에서 잘 보존되지 않으며 따라서 우리에게 중요하지 않습니다. 왜냐하면 그것이 존재한다면 삶이 불가능해지기 때문입니다.

명확성을 달성하는 것은 사람들이 표현하는 것보다 더 미묘합니다.

그렇다면 동시통역을 위해서는 15,000Hz까지의 주파수에 접근하는 것이 필수적이지 않나요?

여기서의 도전은 내가 최선이 아닌 두 번째가 충분하다고 말하는 것처럼 들릴 수 있지만, 이 모든 것의 진실은 명확성을 달성하는 것이 사람들이 표현하고 싶어하는 것보다 더 미묘하다는 점입니다. 동일하게 비교하면, 음성에 대해 15kHz의 대역폭이 10kHz보다 좋으며, 이는 6kHz보다 더 좋습니다.

하지만, 10kHz까지의 더 평탄하고 (부드러운) 응답은 15kHz의 울퉁불퉁한 응답보다 이해에 더 좋을 수 있습니다. 마찬가지로, 6kHz 대역폭으로 동적으로 크게 압축되지 않은 음성은 끔찍한 압축이 적용된 15kHz 대역폭보다 이해하기 더 쉬울 수 있습니다.

이 모든 의미는 주파수 응답을 보존하는 것이 물론 중요하지만, 다른 요인들도 마찬가지이며, 어느 하나만으로는 완벽하게 만들 수 없다는 것입니다. 응답에 대한 특정 문제는 스케일을 올릴수록 수익이 크게 감소한다는 점입니다. 따라서 우리가 높은 레지스터에 집착하는 경향은 그것을 이해하고 쉽게 설명할 수 있기 때문이며, 가치 사슬에서 실제 위치를 반영하는 것은 아닙니다.

15kHz 이상의 대역폭은 좋은 성능을 위한 전체 프로그램의 일부가 되어야 하지만, 문자 그대로는 좋은, 쉬운 이해에 필수적이지도 않으며 보장해 주지도 않습니다.

RSI 플랫폼이 동적 범위 압축을 적용하여 소리가 나쁘게 만든다는 주장들이 있습니다. 이것이 Interprefy에도 해당되나요?

아니오. 일반적인 운영에서는 동적 범위 압축이 필요하지 않습니다. 그것은’ 우리가 절대 사용하지’ 않는다는 뜻은 아닙니다. 현재 실험실에 압축을 적용하는 정말 흥미로운’ 무언가가 있습니다. 그것은’ 청취자를 위해 설계되었으며, 청중이든, 대표이든, 통역가이든 상관없습니다. 각 사람이 원하면 켤 수 있고, 원하지 않’으면 끌 수 있습니다. 

탁월함은 기술을 올바른 장소와 올바른 방식으로 적용함으로써 얻어집니다. It’ s 조정에 관한 것이며, 각 단계에서 완벽을 추구하고, 전체 시스템에 걸쳐 작은 점진적 변화를 적용하는 것입니다.

잠시 대표자에 대해 이야기해 봅시다, 왜냐하면 우리 모두는 연설자가 정말 끔찍하게 들리는 경험을 한 적이 있기 때문입니다.

네. 완전히 도라. 그리고 나는 그것을 없애는 데 정말 열정적이다. 정말 큰 문제는 많은 연설자들이 사용하는 장비가 매우 열악하고, 그들이 음질을 보장하기 위해 해야 할 일을 이해하지 못한다.

우리는 그것을 어떻게 해결합니까?

거의 모든 것과 마찬가지로, 해결책은 다양한 요인들을 해결하는 데 있습니다. 우리는 연설자들이 더 좋은 마이크를 사용하고, 마이크 기술에 대해 더 많이 알고, 배경 소음과 에코에 더 많은 주의를 기울이길 필요합니다. 여기서 해야 할 교육이 많이 있으며, 우리는 또한 우리 스피커 정리 비디오 캠페인.

우리는 여기서 기술을 활용할 수도 있습니다. 미래에는 당신과 제가 이 주제로 돌아와 기술이 사람들의 품질을 향상시키고 그들이 할'수 없는 문제를 보완하는 데 어떻게 도움이 되는지 논의할 수 있습니다.

큰 차이는 잘 구성된 좋은 장비와 잘못 구성된 나쁜 장비 사이에 있습니다.

그러면 하드 콘솔과 같은 하드웨어를 통해 수신된 사운드와 Interprefy를 통해 수신된 사운드를 비교한다면, 연설자가 적절한 장비를 사용하는 한 ’큰 차이가 없을 것입니다

네, 그거’ 맞아요 도라. 여기서 큰 차이는 로컬과 원격 작업 사이가 아니라, 잘 구성된 좋은 장비와 잘못 구성된 열악한 장비 사이입니다. 하드웨어 기반 로컬 시스템의 오디오 품질에는 본질적인 차이가 없습니다. RSI 시스템을 사용하는 많은 회의 및 이벤트 참가자들은 현장에 있는 장비보다 더 좋은 마이크를 가지고 있습니다. 일부는 더 열악한 장치를 사용해 참여하고 싶어합니다. 비즈니스의 모든 것처럼, 적절히 관리되어야 합니다.

그렇다면 RSI와 하드웨어 기반 솔루션의 차이점은 무엇입니까?

RSI가 제공하는 것은 선택입니다. 선택은 유연성을 통해 이루어집니다. 아내가 처음 임신했을 때, 그녀의 고용주인 남자는 단순히 그녀에게 더 이상 일자리가 없다고 말했습니다. 다행히도 그’ s 이제는 불법입니다. 저는 RSI가 여행을 원하지 않거나 할 수 없는(don’ t) 통역사들이 더 유연하게 일할 수 있다는 의미라고 생각합니다. 저는 아내가 겪은 부당한 태도가 마음에 들지 않았고(didn’ t) 고용주가 상황이나 생활 방식에 관계없이 사람들이 일할 수 있도록 모든 노력을 해야 한다고 생각합니다. 따라서 시스템 공급자로서 우리도 그 유연성을 구축해야 한다고 생각합니다.

RSI 솔루션은 조직에도 유연합니다. 어디서든 회의나 컨퍼런스를 개최하고 즉시 설정이나 구성을 변경할 수 있습니다. 최근 우리는 국제우주정거장에서 우주비행사가 전 세계와 대화하도록 도왔습니다. 우주인이 직접 참석하도록 고집하는 것은 물론 터무니없었습니다.

압축으로 돌아가서, 압축을 완전히 없애자고 요구하는 사람들에게 무엇이라고 말하시겠습니까?

압축을 없애는 것, 어떤 형태의 압축이든, 그것이 마법 같은 해결책은 아닙니다. 여기서 다시 강조하고 싶습니다만, 마법 같은 해결책은 없습니다. 전체적인 해결책의 일환으로는 잘못된 압축 사용—동적 압축의 부정확함과 낮은 비트레이트 압축 모두—을 제거하는 것이 포함됩니다. 이는 기술을 이해하고 상세히 파악하는 엔지니어들이 산업 현장에서 일하고 있음을 의미합니다.

여러 압축 함수를 차례대로 사용하는 것은 어떨까요? 자동으로 나쁜가요?

이는 연속 압축이라고 알려져 있습니다. 아니요, 그것'은 자동으로 나쁜 것이 아니라 동적이거나 비트레이트 압축에도 해당됩니다.

계단식 압축과 관련된 구체적인 문제가 있으며, 솔루션을 설계할 때는 열심히 일해야 합니다. It's 매우 합리적인 일이며, 계단식 압축에 대해 걱정하는 것은 많은 노력이 필요하기 때문에 당연합니다, 하지만 you're 능숙하다면, 그것은 가능하고 정말 잘 수행될 수 있습니다. 그리고 정말 잘 수행됩니다. 예를 들어 동적 압축을 살펴보면, 가장 위대한 오디오 혁신 중 두 가지는 계단식 동적 압축을 사용함으로써 탄생했습니다.

일부 사람들은 압축과 같은 요소를 평가하는 데 특히 뛰어난 것처럼 보이는데, 이를 활용해 보시겠습니까?

오디오를 평가하는 방법은 하나뿐이며, 우리는 이를 블라인드 테스트라고 부릅니다. 이상적으로는 이중 블라인드 테스트가 좋습니다. 오디오 문제를 특히 잘 듣는다고 말하는 사람에게는 그것이 블라인드 테스트에서 이루어졌는지 물어보세요. 블라인드 테스트란 평가와 무관한 사람이 진행하는 프로그램에서 어느 것이 어떤 것인지 모르게 테스트하는 것입니다. 모든 테스트는 다양한 청취자를 활용해야 합니다.

많은 사람들, 아마 대부분은, 자신이 뛰어난 청각을 가지고 있다고 생각하지만, 실제로는 20명 중 1명 정도만 그렇습니다. 마치 우리 모두가 운전을 잘한다 생각하는 것과 같습니다.

좋은 사운드는 많은 주의를 기울이고 전체적으로 작업함으로써 달성할 수 있다.

일부 사람들은 음질과 이를 달성하는 방법에 대해 매우 의견이 강한 것처럼 보입니다. 그들에게 당신의 답은 무엇인가요?

이진 용어로 말하고, ‘필수’와 ‘금지’에 대해 이야기하는 사람들은, 경험상 나에게는, 잘못된 사람이다. 나는 압축이나 다른 오디오 도구가 부당하게 나쁜 이름을 얻는 것을 보는 것이 싫다. 내가 그것을 특히 좋아해서가 아니라, 혹은 압축을 특별히 옹호해서가 아니라, 좋은 사운드는 많은 주의를 기울이고 전체적으로 작업함으로써 얻는 것이다. 진정한 완벽주의자는 비이진적이며, 전체 툴킷을 사용하고, 단순한 축소에 빠지지 않는다.

모든 사운드 처리는 잘못될 수도 있고 잘될 수도 있습니다. 잘 수행될 경우, 올바른 구성이 사용되어 유익한 곳에 적용된다는 의미입니다. 동적 압축은 잘못 적용되면 끔찍할 수 있지만, 그것이 보편적으로 잘못된 것이라는 의미는 아닙니다. 올바르게 적용되면, 그것은 놀라운 자산이 됩니다.

전체 게시물 보기