ChatGPT can now see, hear, and speak
Level B1 · ai · multimodal · chatgpt · 1/2/2026 · Source
Bài đọc
OpenAI began rolling out new voice and image capabilities in ChatGPT to make interaction more intuitive.
OpenAI bắt đầu triển khai các khả năng giọng nói và hình ảnh mới trong ChatGPT để tương tác trực quan hơn.
Voice allows back-and-forth conversation, useful on the go or for quick questions.
Voice cho phép hội thoại qua lại, hữu ích khi đang di chuyển hoặc hỏi nhanh.
Image input lets users show ChatGPT what they mean, such as a screenshot, a graph, or a device problem.
Đầu vào hình ảnh cho phép người dùng “cho ChatGPT thấy” ý họ, như ảnh chụp màn hình, biểu đồ, hoặc sự cố thiết bị.
To focus on a part of an image, users can use a drawing tool on mobile.
Để tập trung vào một phần của ảnh, người dùng có thể dùng công cụ vẽ trên mobile.
The voice feature uses a text-to-speech system, and Whisper is used to transcribe spoken words into text.
Tính năng voice dùng hệ thống text-to-speech, và Whisper được dùng để chuyển lời nói thành văn bản.
OpenAI says it is deploying these capabilities gradually to learn from real-world feedback and manage risks.
OpenAI nói họ triển khai dần các khả năng này để học từ phản hồi thực tế và quản lý rủi ro.
They mention risks like impersonation and fraud when synthetic voices become realistic.
Họ nhắc tới rủi ro như giả mạo và lừa đảo khi giọng nói tổng hợp trở nên giống thật.
The rollout started with Plus and Enterprise users, with broader access planned later.
Đợt triển khai bắt đầu với người dùng Plus và Enterprise, và dự kiến mở rộng sau.
Từ vựng cần nhớ
- roll out /roʊl aʊt/triển khai dần
They are rolling out the feature.
Họ đang triển khai dần tính năng.
- capability /ˌkeɪ.pəˈbɪl.ə.ti/khả năng/năng lực
New capabilities improve usability.
Khả năng mới cải thiện tính hữu dụng.
- intuitive /ɪnˈtuː.ə.t̬ɪv/trực quan
An intuitive interface is easy to use.
Giao diện trực quan dễ dùng.
- back-and-forth /ˌbæk.ənˈfɔːrθ/qua lại (hội thoại)
They had a back-and-forth conversation.
Họ có cuộc hội thoại qua lại.
- on the go /ɑːn ðə ɡoʊ/khi đang di chuyển
Use voice on the go.
Dùng voice khi đang di chuyển.
- screenshot /ˈskriːn.ʃɑːt/ảnh chụp màn hình
Share a screenshot to explain the issue.
Chia sẻ screenshot để giải thích vấn đề.
- troubleshoot /ˈtrʌb.əl.ʃuːt/khắc phục sự cố
ChatGPT can help troubleshoot problems.
ChatGPT có thể giúp khắc phục sự cố.
- drawing tool /ˈdrɔː.ɪŋ tuːl/công cụ vẽ
Use the drawing tool to highlight.
Dùng công cụ vẽ để highlight.
- text-to-speech /tekst tə spiːtʃ/chuyển văn bản thành giọng nói
Text-to-speech reads the reply aloud.
Text-to-speech đọc câu trả lời.
- transcribe /trænˈskraɪb/phiên âm/chuyển thành text
Whisper transcribes audio.
Whisper chuyển audio thành text.
- gradually /ˈɡrædʒ.u.ə.li/dần dần
They deploy features gradually.
Họ triển khai tính năng dần dần.
- real-world feedback /ˌrɪəl ˈwɝːld ˈfiːd.bæk/phản hồi thực tế
Real-world feedback improves the product.
Phản hồi thực tế giúp cải thiện sản phẩm.
- manage risks /ˈmæn.ɪdʒ rɪsks/quản lý rủi ro
They manage risks before broad release.
Họ quản lý rủi ro trước khi phát hành rộng.
- impersonation /ɪmˌpɝː.səˈneɪ.ʃən/giả mạo
Impersonation is a major concern.
Giả mạo là mối lo lớn.
- broader access /ˈbrɔː.dɚ ˈæk.ses/quyền truy cập rộng hơn
Broader access is planned later.
Sẽ mở quyền truy cập rộng hơn sau.
Các câu cần nhớ
We are beginning to roll out new capabilities.
Chúng tôi bắt đầu triển khai các khả năng mới.
Beginning to roll out = bắt đầu triển khai dần.
Voice enables a back-and-forth conversation.
Voice cho phép hội thoại qua lại.
Enable = cho phép.
You can show ChatGPT what you mean by sharing an image.
Bạn có thể cho ChatGPT thấy ý bạn bằng cách chia sẻ hình ảnh.
Show what you mean = cho thấy ý bạn.
To focus on a specific part, use the drawing tool.
Để tập trung vào phần cụ thể, dùng công cụ vẽ.
To + verb = để.
Whisper is used to transcribe spoken words into text.
Whisper được dùng để chuyển lời nói thành văn bản.
Passive voice.
We are deploying these features gradually.
Chúng tôi triển khai các tính năng này dần dần.
Gradually = dần dần.
This helps us learn from real-world feedback and manage risks.
Điều này giúp chúng tôi học từ phản hồi thực tế và quản lý rủi ro.
Two verbs with and.
Broader access is planned later.
Quyền truy cập rộng hơn dự kiến sẽ có sau.
Planned later = dự kiến sau.