opslab-english
← Back to Lessons

ChatGPT can now see, hear, and speak

Level B1 · ai · multimodal · chatgpt · 1/2/2026 · Source

Bài đọc

OpenAI began rolling out new voice and image capabilities in ChatGPT to make interaction more intuitive.

OpenAI bắt đầu triển khai các khả năng giọng nói và hình ảnh mới trong ChatGPT để tương tác trực quan hơn.

Voice allows back-and-forth conversation, useful on the go or for quick questions.

Voice cho phép hội thoại qua lại, hữu ích khi đang di chuyển hoặc hỏi nhanh.

Image input lets users show ChatGPT what they mean, such as a screenshot, a graph, or a device problem.

Đầu vào hình ảnh cho phép người dùng “cho ChatGPT thấy” ý họ, như ảnh chụp màn hình, biểu đồ, hoặc sự cố thiết bị.

To focus on a part of an image, users can use a drawing tool on mobile.

Để tập trung vào một phần của ảnh, người dùng có thể dùng công cụ vẽ trên mobile.

The voice feature uses a text-to-speech system, and Whisper is used to transcribe spoken words into text.

Tính năng voice dùng hệ thống text-to-speech, và Whisper được dùng để chuyển lời nói thành văn bản.

OpenAI says it is deploying these capabilities gradually to learn from real-world feedback and manage risks.

OpenAI nói họ triển khai dần các khả năng này để học từ phản hồi thực tế và quản lý rủi ro.

They mention risks like impersonation and fraud when synthetic voices become realistic.

Họ nhắc tới rủi ro như giả mạo và lừa đảo khi giọng nói tổng hợp trở nên giống thật.

The rollout started with Plus and Enterprise users, with broader access planned later.

Đợt triển khai bắt đầu với người dùng Plus và Enterprise, và dự kiến mở rộng sau.

Từ vựng cần nhớ

  • roll out /roʊl aʊt/
    triển khai dần

    They are rolling out the feature.

    Họ đang triển khai dần tính năng.

  • capability /ˌkeɪ.pəˈbɪl.ə.ti/
    khả năng/năng lực

    New capabilities improve usability.

    Khả năng mới cải thiện tính hữu dụng.

  • intuitive /ɪnˈtuː.ə.t̬ɪv/
    trực quan

    An intuitive interface is easy to use.

    Giao diện trực quan dễ dùng.

  • back-and-forth /ˌbæk.ənˈfɔːrθ/
    qua lại (hội thoại)

    They had a back-and-forth conversation.

    Họ có cuộc hội thoại qua lại.

  • on the go /ɑːn ðə ɡoʊ/
    khi đang di chuyển

    Use voice on the go.

    Dùng voice khi đang di chuyển.

  • screenshot /ˈskriːn.ʃɑːt/
    ảnh chụp màn hình

    Share a screenshot to explain the issue.

    Chia sẻ screenshot để giải thích vấn đề.

  • troubleshoot /ˈtrʌb.əl.ʃuːt/
    khắc phục sự cố

    ChatGPT can help troubleshoot problems.

    ChatGPT có thể giúp khắc phục sự cố.

  • drawing tool /ˈdrɔː.ɪŋ tuːl/
    công cụ vẽ

    Use the drawing tool to highlight.

    Dùng công cụ vẽ để highlight.

  • text-to-speech /tekst tə spiːtʃ/
    chuyển văn bản thành giọng nói

    Text-to-speech reads the reply aloud.

    Text-to-speech đọc câu trả lời.

  • transcribe /trænˈskraɪb/
    phiên âm/chuyển thành text

    Whisper transcribes audio.

    Whisper chuyển audio thành text.

  • gradually /ˈɡrædʒ.u.ə.li/
    dần dần

    They deploy features gradually.

    Họ triển khai tính năng dần dần.

  • real-world feedback /ˌrɪəl ˈwɝːld ˈfiːd.bæk/
    phản hồi thực tế

    Real-world feedback improves the product.

    Phản hồi thực tế giúp cải thiện sản phẩm.

  • manage risks /ˈmæn.ɪdʒ rɪsks/
    quản lý rủi ro

    They manage risks before broad release.

    Họ quản lý rủi ro trước khi phát hành rộng.

  • impersonation /ɪmˌpɝː.səˈneɪ.ʃən/
    giả mạo

    Impersonation is a major concern.

    Giả mạo là mối lo lớn.

  • broader access /ˈbrɔː.dɚ ˈæk.ses/
    quyền truy cập rộng hơn

    Broader access is planned later.

    Sẽ mở quyền truy cập rộng hơn sau.

Các câu cần nhớ

  • We are beginning to roll out new capabilities.

    Chúng tôi bắt đầu triển khai các khả năng mới.

    Beginning to roll out = bắt đầu triển khai dần.

  • Voice enables a back-and-forth conversation.

    Voice cho phép hội thoại qua lại.

    Enable = cho phép.

  • You can show ChatGPT what you mean by sharing an image.

    Bạn có thể cho ChatGPT thấy ý bạn bằng cách chia sẻ hình ảnh.

    Show what you mean = cho thấy ý bạn.

  • To focus on a specific part, use the drawing tool.

    Để tập trung vào phần cụ thể, dùng công cụ vẽ.

    To + verb = để.

  • Whisper is used to transcribe spoken words into text.

    Whisper được dùng để chuyển lời nói thành văn bản.

    Passive voice.

  • We are deploying these features gradually.

    Chúng tôi triển khai các tính năng này dần dần.

    Gradually = dần dần.

  • This helps us learn from real-world feedback and manage risks.

    Điều này giúp chúng tôi học từ phản hồi thực tế và quản lý rủi ro.

    Two verbs with and.

  • Broader access is planned later.

    Quyền truy cập rộng hơn dự kiến sẽ có sau.

    Planned later = dự kiến sau.