công cụ giả giọng nói trên âm thanh chỉ 15 giây

OpenAI ra mắt công cụ giả giọng nói trên âm thanh chỉ 15 giây – Bạn đã biết chưa?

Khi công nghệ tiến bộ, biên độ sự sáng tạo mở ra những khả năng mới, và trong làn sóng của sự phát triển ấy, OpenAI – tập đoàn nổi tiếng về trí tuệ nhân tạo – đã gây chú ý mạnh mẽ với việc ra mắt công cụ giả giọng nói dựa trên mẫu âm thanh chỉ 15 giây. Đây không chỉ là một bước tiến quan trọng trong việc phát triển trí tuệ nhân tạo, mà còn mở ra một loạt các ứng dụng tiềm năng trong nhiều lĩnh vực từ giáo dục đến giải trí, và thậm chí cả trong việc tạo ra nội dung đa phương tiện chất lượng cao. Hãy cùng Hieuai tìm hiểu rõ hơn về công cụ này qua bài viết dưới đây bạn nhé!

Công cụ nhân bản giọng nói dựa trên mẫu âm thanh 15 giây

OpenAI đã tiến hành một bước đột phá với việc giới thiệu công cụ nhân bản giọng nói mới, được gọi là “Voice Engine”. Tuy nhiên, điểm đáng chú ý là công ty đã cam kết kiểm soát chặt chẽ việc sử dụng công cụ này cho đến khi các biện pháp bảo vệ cần thiết được áp dụng để ngăn chặn việc lạm dụng, đặc biệt là trong việc tạo ra các tin tức giả âm thanh nhằm đánh lừa người nghe.

công cụ giả giọng nói trên âm thanh chỉ 15 giây
OpenAI đã giới thiệu công cụ nhân bản giọng nói mới, gọi là Voice Engine

Trong bài đăng trên blog của OpenAI, họ chia sẻ kết quả thử nghiệm quy mô nhỏ của Voice Engine, nơi công cụ này đã thể hiện khả năng sao chép giọng nói của một cá nhân dựa trên mẫu âm thanh chỉ trong vòng 15 giây. Điều này là một bước tiến quan trọng, mở ra nhiều tiềm năng trong việc phát triển ứng dụng của công nghệ trong các lĩnh vực như giải trí, giáo dục và giao tiếp.

Tuy nhiên, để đảm bảo rằng công cụ này không bị lạm dụng, OpenAI đã cam kết áp dụng các biện pháp bảo vệ mạnh mẽ và kiểm soát chặt chẽ. Việc này là cực kỳ quan trọng để đảm bảo rằng công nghệ được sử dụng một cách đạo đức và có trách nhiệm, đặc biệt là trong bối cảnh nguy cơ của việc tạo ra tin giả âm thanh.

Xem thêm video về thông tin liên quan đến sự ra mắt của công cụ này:

Rủi ro tiềm ẩn

OpenAI đã mạnh mẽ thừa nhận rằng việc phát triển công nghệ giọng nói mang theo những rủi ro đáng kể, đặc biệt là trong bối cảnh các sự kiện như năm bầu cử. Tuy nhiên, công ty này cũng khẳng định đang tích cực hợp tác với các đối tác cả trong và ngoài nước, bao gồm chính phủ, các cơ quan truyền thông, giải trí, giáo dục, và tổ chức xã hội dân sự, nhằm tiếp thu ý kiến phản hồi và xây dựng công cụ này một cách an toàn và có trách nhiệm.

Có thể bạn thích:  UDIO là gì? Tìm hiểu công dụng hữu ích của UDIO

Trong tinh thần đó, OpenAI đã triển khai một loạt các biện pháp an toàn, bao gồm việc đánh dấu nguồn gốc của mọi âm thanh được tạo ra bởi Voice Engine cũng như theo dõi chặt chẽ cách thức sử dụng công cụ này. Điều này giúp công ty đảm bảo rằng công nghệ của họ được áp dụng một cách đúng đắn và không gây hậu quả không mong muốn cho cộng đồng và xã hội. Nhờ vào những biện pháp này, OpenAI hy vọng rằng công cụ giả giọng nói mới sẽ mang lại lợi ích và giá trị cho mọi người một cách an toàn và bền vững.

công cụ giả giọng nói trên âm thanh chỉ 15 giây
OpenAI đã triển khai một loạt các biện pháp an toàn

OpenAI thử nghiệm mô hình chuyển văn bản thành video – Sora

Tháng 2 vừa qua, OpenAI đã tuyên bố đang tiến hành thử nghiệm một mô hình độc đáo mang tên Sora, một công cụ có khả năng chuyển văn bản thành video một cách nhanh chóng và chân thực chỉ thông qua một câu lệnh đơn giản. Sự xuất hiện của Sora đã gây nên sự hào hứng đặc biệt trong cộng đồng các chuyên gia truyền thông và họa sĩ thiết kế game, bởi khả năng này có thể mang lại một cuộc cách mạng trong việc sản xuất nội dung video.

Sora không chỉ được đánh giá là có thể tăng tốc độ làm việc của các nhà làm phim mà còn có thể thay thế hoàn toàn những kỹ sư đồ họa ít kinh nghiệm. Tuy nhiên, sự phát triển này cũng gây ra những lo ngại nghiêm trọng từ các nhà nghiên cứu về thông tin sai lệch. Họ lo ngại về nguy cơ từ việc lạm dụng các ứng dụng chạy bằng trí tuệ nhân tạo, đặc biệt là các công cụ nhân bản giọng nói, bởi tính tiện lợi, dễ sử dụng và khó truy vết của chúng.

Một ví dụ rõ ràng nhất là sự cố gần đây khi một cuộc gọi được tạo ra bằng trí tuệ nhân tạo, với giọng nói giống hệt Tổng thống Joe Biden, được phát đi kêu gọi mọi người không tham gia vào cuộc bầu cử sơ bộ New Hampshire vào tháng 1/2024. Sự việc này đã khiến các chuyên gia cảnh báo về nguy cơ của một làn sóng thông tin sai lệch dạng Deepfake (âm thanh hoặc video giả mạo) do trí tuệ nhân tạo tạo ra trong cuộc đua vào Nhà Trắng năm 2024 cũng như các cuộc bầu cử quan trọng khác trên toàn cầu trong năm nay.

Việc OpenAI ra mắt công cụ giả giọng nói trên mẫu âm thanh chỉ trong 15 giây không chỉ là một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo, mà còn là một minh chứng cho sự khả năng vô tận của con người trong việc sáng tạo và ứng dụng công nghệ. Tuy nhiên, điều quan trọng nhất là cách chúng ta sử dụng công nghệ này để mang lại giá trị cho xã hội và đảm bảo rằng nó được áp dụng một cách đạo đức và có trách nhiệm. Hy vọng rằng sự tiến bộ này sẽ dẫn đến những cải tiến đáng kể trong nhiều lĩnh vực và giúp cho thế giới trở nên một nơi tốt đẹp hơn cho tất cả mọi người.

Có thể bạn thích:  Tìm hiểu về công cụ AI phát hiện Deepfake Audio của McAfee

 

Vũ Thanh Mai

Change the world by being yourself

Similar Posts

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *