tm-hub-library internal

영상 속 정보를 텍스트로 추출하여 월 8억 버는 스타트업

published Brand: Twelve Labs 월 8억 Updated: 2025-04-17
Entrepreneur
Jae Lee
Category
소프트웨어
Views
121

📋 한 줄 요약 영상 속 정보를 텍스트로 추출하여 월 8억 원의 매출을 올리는 스타트업 Twelve Labs의 성공 이야기.

🎯 비즈니스 모델 Twelve Labs는 영상, 오디오, 음성을 통합적으로 이해하는 AI 기술을 개발하여 API 기반으로 제공하며, 유료 및 무료 계획을 통해 수익을 창출하고 있다.

💡 핵심 인사이트

🚀 성공 요인

📈 성과


💡비즈니스와 자신을 소개해주세요!

저는 Twelve Labs의 공동 창업자이자 CEO, Jae Lee입니다.

서울에서 태어나고 자랐어요.

이후 미국으로 건너가 UC 버클리(캘리포니아 대학교 버클리 캠퍼스)에서 컴퓨터공학을 전공했어요.

그리고 군 복무 중에 지금의 회사를 창업하게 됐죠.

💡Twelve Labs는 어떤 문제를 해결하나요?

Twelve Labs는 사람들이 원하는 장면이나 특정 정보를 긴 영상 안에서 빠르고 정확하게 찾아낼 수 있게 도와주는 기술을 만들어요.

복잡하고 방대한 영상들을 일일이 확인하면서 생기는 피로감이나 시간 낭비를 줄여주는 데 집중하고 있죠.

결국, 영상 콘텐츠를 쉽게 이해하고 활용할 수 있게 만드는 일이라고 할 수 있죠.

Twelvelabs

💡이 아이디어를 어떻게 떠올리셨나요?

제가 Twelve Labs의 아이디어를 처음 떠올린 건, 군 복무 중이었어요.

당시에 사이버사령부에서 근무하면서 인공지능에 열정을 가진 분들과 함께 협업할 기회가 있었는데요.

그 환경 자체가 워낙 혁신적인 에너지로 가득했어요.

그곳에서 일하다 보니 자연스럽게 AI 업계 전반을 들여다보게 됐고, 그 안에서 하나의 큰 공백을 발견하게 됐어요.

바로, 텍스트와 이미지 처리에는 엄청난 발전이 있었지만, 영상 이해에 대한 연구는 생각보다 너무 부족하다는 점이었어요.

요즘처럼 영상 데이터가 폭발적으로 늘어나고 있는 시대에, 영상 AI는 정말 필요한 분야인데도 말이죠.

그때 저는 '이건 분명히 AI가 더 나아가야 할 핵심 영역이다'라는 확신이 들었어요.

그래서 본격적으로 멀티모달 기반의 영상 이해 기술을 탐구하기 시작했죠.

동료들과 함께 수많은 대화를 나누고, 자료를 찾아보면서 점점 더 확신이 들었어요.

시장도, 기술도 영상이라는 복잡한 데이터를 제대로 다룰 기반이 절대적으로 부족하다는 사실이 명확해졌거든요.

이건 단순한 불편함이 아니라, 앞으로 AI가 도약하기 위해 꼭 풀어야 할 문제라고 생각했어요.

이때부터 저와 공동 창업자들은 가진 게 많지는 않았지만, 뚜렷한 신념 하나로 이 아이디어를 실현시켜보자고 결심했어요.

다행히 뜻이 맞는 분들이 주위에 있었고, 그분들의 응원과 함께 스타트업의 기반을 하나씩 쌓아가기 시작했죠.

물론 순탄한 길만 있었던 건 아니에요.

핵심 아이디어를 시장에서 검증받는 일도, 필요한 자금을 확보하는 것도 쉽지 않았어요.

하지만 저는 흔들리지 않았어요.

영상을 이해하는 기술이라는 아직 덜 다뤄진 영역에 집중하면, 분명히 길이 열릴 거라 믿었어요.

그리고 이 경험을 통해 저는 깨달았어요.

빠르게 변하는 기술 환경 속에서 아직 누구도 제대로 건드리지 않은 문제를 찾아내고,

자신의 경험과 네트워크를 활용해 그걸 해결해 나가는 것이야말로 창업자가 해야 할 가장 중요한 역할이라는 걸요.

💡초기 버전은 어떻게 만드셨나요?

Twelve Labs는 말 그대로 영상을 진짜로 이해할 수 있는 AI 모델을 만들겠다는 목표로 시작됐어요.

저희 팀은 멀티모달 영상 이해라는 인프라를 구축하기 위해 본격적으로 뛰어들었어요.

그리고 그 핵심은 영상, 오디오, 음성 데이터를 통합해서 다룰 수 있는 기술이었어요.

그래서 처음부터 전용 AI 모델들을 직접 개발해야 했어요.

대표적으로 Pegasus-1이라는 모델이 있었는데요.

이 모델은 영상에서 주제를 뽑아내거나 요약을 자동으로 생성하는 기능을 갖췄어요.

그런데 이런 기능을 구현하려면 정말 방대한 영상 데이터를 처리해야 하거든요.

그래서 저희는 완전히 새로운 기술 스택을 짜야 했어요.

정교한 AI 모델, API, 도메인 특화 학습 등 전부 직접 설계하고 구축해야 했죠.

당연히 초기에는 자금도 넉넉하지 않았어요.

그래서 저희는 작은 초기 자본을 최대한 전략적으로 활용해야 했고, Oracle Cloud Infrastructure와의 협업을 통해 연산 자원도 확보했어요.

이런 식으로 창의적인 방식으로 문제를 풀어가면서, 기술적인 한계를 하나씩 돌파해 나갔어요.

그 과정에서 저희는 단순한 영상 분석이 아니라, 실제로 ‘이해’하는 수준에 가까운 AI를 만들어낼 수 있었어요.

그 결과, 업계에서도 점점 저희 기술에 관심을 갖기 시작했고, 다양한 기업들과의 파트너십도 맺게 됐죠.

💡초기비용은 얼마나 들었나요?

저희 Twelve Labs는 초기에 엔비디아, 인텔, 삼성 넥스트로부터 전략적 투자를 유치했어요.

그때 받은 금액이 약 140억 원(1,000만 달러) 정도였고요,

이 투자 덕분에 누적 투자금이 약 375억 원(2,700만 달러)까지 올라갔어요.

그리고 나중에는 Snowflake, Databricks, 그리고 다른 여러 투자자들로부터 추가로 약 420억 원(3,000만 달러)을 더 유치했어요.

이렇게 해서 지금까지 총 투자금은 800억 원 이상이에요.

💡성장 전략, 그리고 확장 전략은 무엇이었나요?

✅ 개발자 커뮤니티와의 소통

저희는 초창기부터 개발자 커뮤니티와의 연결에 정말 공을 들였어요.

저희가 만든 API를 누구나 쓸 수 있게 오픈했고, 현재는 전 세계 2만 명 이상의 개발자들이 저희 API를 직접 활용하고 있어요.

이걸 통해 개발자들이 자기만의 앱이나 프로젝트 안에 저희의 ‘영상 이해 기술’을 직접 넣어볼 수 있게 했고요.

이 과정에서 정말 다양한 실험과 혁신이 이루어졌어요.

✔️왜 효과적이었을까요?

개발자들은 늘 새로운 기술을 적용해보고 싶어 하잖아요.

그래서 저희처럼 강력한 도구를 무료 또는 아주 저렴한 비용으로 제공하면, 자연스럽게 많은 사용자가 생겨요.

그리고 피드백도 쌓이면서 기술과 제품 모두 빠르게 발전할 수 있었어요.

✅ 전략적 파트너십

저희는 성장 과정에서 엔비디아, 인텔, 삼성 넥스트와 전략적 파트너십을 맺었어요.

이 분들은 단순한 투자자를 넘어서 업계 내에서 저희 신뢰도를 확 높여준 든든한 동반자였어요.

✔️왜 효과적이었을까요?

가령 엔비디아와의 파트너십 덕분에 최첨단 컴퓨팅 리소스와 AI 기술 노하우를 확보할 수 있었어요.

이런 지원은 저희 R&D 속도를 훨씬 더 빠르게 만들어줬고, 기술 완성도를 높이는 데 큰 도움이 됐죠.

그리고 이런 빅테크 기업들과 함께 일하고 있다는 사실 자체가, 잠재 고객이나 개발자들에게 신뢰를 줄 수 있는 강력한 증거가 되기도 했어요.

✅ 국제 대회 참여와 노출 전략

저희는 ICCV (국제 컴퓨터 비전 학회) 같은 주요 학회에 직접 참여했어요.

거기서 저희 기술로 상도 받았고, 자연스럽게 업계 안팎에서 많은 주목을 받을 수 있었죠.

✔️왜 효과적이었을까요?

권위 있는 대회에서 수상하면, 기술력을 전문가와 투자자 모두에게 공식적으로 인정받을 수 있거든요.

덕분에 벤처캐피탈이나 엔터프라이즈 고객들로부터 먼저 연락이 오기도 했어요.

그리고 사업 성장 속도도 훨씬 빨라졌죠.

✅ 입소문과 직접 데모 전략

저희는 입소문도 굉장히 효과적으로 활용했어요.

특히 미디어, 엔터테인먼트, 스포츠, 보안 같은 분야의 기업들을 대상으로 직접 데모를 보여주는 방식을 자주 썼어요.

✔️왜 효과적이었을까요?

사실 영상 AI는 말로 설명하는 것보다 직접 보여주는 게 훨씬 설득력이 있어요.

그래서 고객이 자기 업계에 딱 맞는 시나리오를 직접 보게 되면, 진짜 필요하겠다는 생각을 하게 돼요.

그리고 실제로 구매까지 이어지는 속도도 훨씬 빨라지더라고요.

ROI(투자 대비 수익)도 바로 체감할 수 있어서, 설득하는 데 시간이 오래 걸리지 않았어요.

💡가격 전략은 무엇인가요?

저희는 API 기반의 티어 요금제를 운영하고 있어요.

개발자들을 위한 무료 요금제도 제공하고,

그 이상 필요한 분들을 위해 월 6만 7천 원(49달러)부터 유료 플랜이 시작돼요.

사용량에 따라 확장 가능한 구조라, 다양한 규모의 사용자들이 부담 없이 접근할 수 있게 만들었죠.

💡사업을 시작하면서 배운 가장 큰 교훈은 무엇이었나요?

✔️멘토는 선별적으로 받아들여야 해요

창업을 하다 보면 정말 다양한 조언을 듣게 되는데요,

모든 말을 다 따르기보단, 우리 비전에 맞지 않는 조언은 과감히 거절할 용기가 필요하더라고요.

그래야 중심을 잃지 않아요.

✔️진짜 고객에게 집중하자

제품을 ‘그냥 사줄 사람’이 아니라, 진짜 필요로 하고, 가치를 느끼는 사람에게 집중해야 해요.

그래야 리소스를 낭비하지 않고, 훨씬 단단하게 성장할 수 있어요.

✔️실패와 피드백은 최고의 교과서

한때는 저희도 제품을 너무 과하게 포장한 적이 있었어요.

그런데 그게 오히려 신뢰를 떨어뜨릴 수도 있다는 걸 배웠죠.

오히려 우리 기술을 진짜 이해하고, 스스로 가치를 알아보는 고객이 훨씬 효율적이에요.

✔️핵심 역량에 집중해야 해요

처음엔 이것저것 시도해보고 싶었는데, 결국 가장 잘하는 영역을 하게 되더라고요.

저희는 인프라와 개발자 솔루션에 집중했을 때 가장 의미 있는 성과가 나왔어요.

이건 정말 중요한 교훈이었어요.

✔️건강한 파트너십이 핵심이에요

저희 팀은 서로의 강점을 믿고, 서로 다른 의견에도 열려 있는 소통 구조를 만들려고 늘 노력해요.

이게 결국 지속 가능한 성장을 가능하게 해주는 힘이라고 생각해요.

Local Graph