Nástroje pro generování hlasu ElevenLabs jsou spuštěny ve verzi beta

Nástroje pro generování hlasu ElevenLabs jsou spuštěny ve verzi beta

ElevenLabs , virální platforma pro vytváření syntetických hlasů poháněná umělou inteligencí, dnes spustila svou platformu mimo beta verzi s podporou více než 30 jazyků.

Pomocí nového modelu umělé inteligence vyvinutého interně ElevenLabs říká, že jeho nástroje jsou nyní schopny automaticky identifikovat jazyky, včetně korejštiny, holandštiny a vietnamštiny, a generovat v těchto jazycích emocionálně bohatou řeč.

V kombinaci s novým modelem mohou zákazníci ElevenLabs využít nástroj pro hlasové klonování platformy, aby mohli mluvit téměř 30 jazyky, aniž by museli nejprve psát text.



ai ročenka aplikace

Společnost ElevenLabs byla založena se snem učinit veškerý obsah univerzálně dostupným v jakémkoli jazyce a jakýmkoli hlasem, uvedl v prohlášení generální ředitel a spoluzakladatel ElevenLabs Mati Staniszewski. S tímto vydáním jsme o krok blíže k uskutečnění tohoto snu a zpřístupnění hlasů umělé inteligence v lidské kvalitě v každém dialektu. Naše nástroje pro generování převodu textu na řeč pomáhají vyrovnat podmínky a přinášejí všem tvůrcům možnosti mluveného zvuku špičkové kvality.

ElevenLabs, kterou založil Staniszewski, který dříve pracoval ve společnosti Palantir, a jeho přítel z dětství Piotr Dabkowski, bývalý zaměstnanec společnosti Google, se v posledních měsících dostaly na titulní stránky z obou důvodů. dobrý a odporný . Inspirováni průměrným dabingem amerických filmů, které Staniszewski a Dabkowski sledovali, když vyrůstali v Polsku, se dvojice pustila do návrhu platformy, která by mohla být lepší – samozřejmě využívající AI.

ElevenLabs byla spuštěna v beta verzi koncem ledna a nabrala rychlost poměrně rychle – díky vysoké kvalitě generovaných hlasů a velkorysé bezplatné úrovni. Ale jak již bylo zmíněno dříve, publicita nebyla trvale pozitivní – zvláště poté, co špatní herci využili platformu pro své vlastní účely.

Nechvalně známá nástěnka 4chan, známá svým konspirativním obsahem, použitý Nástroje ElevenLabs pro sdílení nenávistných zpráv napodobujících celebrity, jako je herečka Emma Watson. Jinde byl James Vincent z The Verge schopen klepnout na ElevenLabs a naklonovat hlasy cílů během několika sekund, generování zvukové ukázky obsahující vše od výhrůžek násilí po projevy rasismu a transfobie.

V reakci na to ElevenLabs uvedl, že zavede sadu nových ochranných opatření, jako je omezení klonování hlasu na placené účty a poskytnutí nového nástroje pro detekci AI.

ElevenLabs se však ještě musí potýkat s další kontroverzí, která se kolem její platformy a dalších platforem jí podobných: jejich hrozba pro průmysl hlasových her.

Základní deska píše o tom, jak jsou hlasoví herci stále častěji žádáni, aby podepsali práva na své hlasy, aby klienti mohli pomocí umělé inteligence vytvářet syntetické verze, které by je nakonec mohly nahradit. Mezitím interní e-maily viděl The New York Times naznačují, že Activision Blizzard, jeden z největších herních vydavatelů na světě, pracuje na nástrojích pro klonování hlasu za pomoci umělé inteligence.

Zdálo by se, že ElevenLabs to vidí jako přirozený vývoj věcí a vychvaluje svou práci s vydavateli, jako je Storytel; mediální platformy jako TheSoul Publishing a MNTN pro audioknihy a rozhlasový obsah; a vydavatelé jako Embark Studios a Paradox Interactive pro videohry (Storytel a TheSoul Publishing jsou strategičtí investoři). Společnost tvrdí, že má více než milion registrovaných uživatelů v kreativních, zábavních a publikačních prostorech, kteří vytvořili zvukový obsah za 10 let.

nové smluvní podmínky snapchatu

Společnost ElevenLabs, která nedávno získala 19 milionů dolarů od investorů, včetně Andreessena Horowitze a spoluzakladatele DeepMind Mustafy Suleymana za cenu 99 dolarů, plánuje nakonec rozšířit své modely umělé inteligence na dabing – ve stopách startupů jako Papercup a Deepdub a vybudovat to, co umí. vyzývá nadaci, aby byla schopna přenášet emoce a intonaci z jednoho jazyka do druhého.

Kromě toho to říká ElevenLabsplánuje zavést mechanismus, který uživatelům umožní sdílet hlasy na platformě, i když podrobnosti zůstávají mlhavé.