Memories AI - công ty tạo 'ký ức' cho robot và thiết bị đeo có gì mới?
Memories AI là một công ty công nghệ đang phát triển giải pháp "tầng bộ nhớ thị giác" nhằm nâng cao khả năng ghi nhớ và tái hiện ký ức cho robot và các thiết bị đeo thông minh. Thông qua việc lưu trữ và xử lý hình ảnh, hệ thống của Memories AI giúp các thiết bị này không chỉ nhận diện môi trường xung quanh mà còn có thể ghi nhớ các sự kiện, trải nghiệm trước đó. Công nghệ này mở ra nhiều tiềm năng ứng dụng trong lĩnh vực tự động hóa, chăm sóc sức khỏe và tương tác người-máy, góp phần làm tăng hiệu quả và tính linh hoạt của các thiết bị thông minh trong cuộc sống hàng ngày.

Insight Summary
Tóm tắt nhanh
- Memories AI là công ty làm công nghệ giúp robot và thiết bị đeo “nhớ” được những gì chúng nhìn thấy.
- Công ty này tin rằng AI muốn hoạt động tốt ngoài đời thực thì phải có khả năng lưu và tìm lại ký ức hình ảnh.
- Họ đang hợp tác với Nvidia để xây nền tảng xử lý video và hình ảnh thông minh hơn.
- Memories AI từng làm công nghệ cho kính Meta Ray-Ban rồi tách ra thành công ty riêng vào năm 2024.
- Hiện công ty có sản phẩm thử nghiệm cho tìm kiếm video, camera an ninh và đang chuẩn bị mở rộng sang điện thoại, kính thực tế ảo và máy tính.
Bài viết tổng hợp
Nếu AI chỉ làm việc với chữ và câu trả lời trên màn hình, nó đã khá mạnh. Nhưng khi bước ra thế giới thật, AI phải nhìn, hiểu và nhớ những gì đang xảy ra trước mắt. Đó là hướng đi của Memories AI, một công ty khởi nghiệp ở San Francisco đang xây công nghệ “ký ức thị giác”. Nói đơn giản, họ muốn giúp robot, camera hay thiết bị đeo có thể nhớ lại một cảnh đã nhìn thấy, thay vì chỉ ghi hình rồi để đó. Người đồng sáng lập Shawn Shen cho rằng nếu AI muốn thực sự hữu ích trong đời sống vật lý, nó không thể chỉ “đọc chữ giỏi”. Nó còn phải nhớ được hình ảnh, chuyển động, đồ vật và bối cảnh xung quanh. Điều này khác với kiểu nhớ mà người dùng đã quen trên các chatbot. Với chatbot, “nhớ” thường là nhớ nội dung trò chuyện trước đây bằng văn bản. Còn với Memories AI, thứ cần nhớ là video, hình ảnh và các khoảnh khắc ngoài đời thực. Công ty đang đi theo hướng xây dựng một “bộ nhớ” cho máy móc.
Đây không phải trí nhớ theo kiểu con người, mà là cách lưu trữ dữ liệu hình ảnh sao cho AI có thể tìm lại nhanh, hiểu đúng và dùng lại khi cần. Memories AI vừa xuất hiện tại sự kiện GTC 2026 của Nvidia với vai trò đối tác. Đây là sự kiện lớn nơi Nvidia giới thiệu các công nghệ mới cho AI, robot và máy tính. Công ty đang dùng các công cụ của Nvidia để phát triển nền tảng của mình, gồm một mô hình suy luận về video và một công cụ tìm kiếm, tóm tắt video. Hiểu đơn giản, thay vì xem lại hàng giờ video, hệ thống có thể trả lời kiểu: “người mặc áo đỏ xuất hiện lúc nào?”, hoặc “đoạn có chiếc xe đi vào gara ở đâu?”. Sự hợp tác này được xem là bước quan trọng vì Memories AI cần rất nhiều năng lực xử lý dữ liệu hình ảnh. Video nặng hơn văn bản rất nhiều, nên muốn máy tìm kiếm và ghi nhớ được, công ty phải có hạ tầng đủ mạnh để lưu trữ, phân loại và truy xuất nhanh.
Shawn Shen và Ben Zhou, đồng sáng lập kiêm giám đốc công nghệ của công ty, không phải người mới trong mảng này. Trước đó, họ từng tham gia xây dựng hệ thống AI cho kính Meta Ray-Ban. Trong quá trình làm việc ở Meta, cả hai nhận ra một vấn đề thực tế: thiết bị đeo thông minh có thể quay và quan sát, nhưng nếu không có cách truy xuất lại video một cách hiệu quả thì dữ liệu đó gần như khó dùng. Từ đó, họ nghĩ đến việc tạo ra một lớp “ký ức” riêng cho các thiết bị AI. Sau đó, họ rời Meta và lập Memories AI vào năm 2024. Mục tiêu của họ là tự xây công nghệ thay vì chỉ tích hợp vào sản phẩm của người khác. Điểm đáng chú ý là trí nhớ của AI không còn là khái niệm quá xa lạ. OpenAI đã bổ sung tính năng nhớ các cuộc trò chuyện cũ trên ChatGPT. Google Gemini và xAI của Elon Musk cũng có tính năng tương tự. Nhưng theo Memories AI, những công cụ này chủ yếu vẫn phục vụ cho văn bản.
Văn bản có cấu trúc rõ hơn, dễ tìm kiếm và gắn nhãn hơn video rất nhiều. Video lại là chuyện khác. Một đoạn video 10 phút có thể chứa rất nhiều người, đồ vật, hành động và bối cảnh thay đổi liên tục. Vì vậy, nếu muốn AI “nhớ” video, cần một cách hoàn toàn khác để sắp xếp dữ liệu. Memories AI gọi hướng đi của mình là “tầng bộ nhớ thị giác”. Có thể hiểu nôm na đây là lớp trung gian giúp AI biến video thành dữ liệu có thể lưu, tìm, và hỏi đáp được.
Để làm được điều đó, công ty nói rằng họ cần hai việc chính
- Xây hạ tầng để đưa video vào hệ thống theo cách có thể tìm lại rất nhanh.
- Có dữ liệu đủ tốt để huấn luyện mô hình hiểu video giống như cách con người nhận ra người, vật và hành động.
Năm 2025, công ty ra mắt mô hình LVMM, viết tắt của “Mô hình Bộ nhớ Thị giác Lớn”. Đây là công nghệ lõi giúp người dùng tìm một khoảnh khắc trong video chỉ trong thời gian rất ngắn. Phiên bản LVMM 2.0 sau đó được giới thiệu để tăng khả năng hỏi đáp bằng ngôn ngữ tự nhiên. Nghĩa là người dùng không cần biết lệnh kỹ thuật mà chỉ cần hỏi như bình thường, ví dụ: “Tìm đoạn có con mèo chạy qua phòng khách” hoặc “Lấy cảnh tôi để quên chìa khóa ở đâu”. Một điểm nữa là hệ thống này không chỉ hữu ích với video cá nhân. Nó còn có thể giúp sắp xếp ảnh, video kỷ niệm trong album, hoặc hỗ trợ camera an ninh hiểu sự việc tốt hơn. Nói cách khác, thay vì chỉ ghi lại hình ảnh, camera có thể hỗ trợ phân tích sự kiện trong thời gian thực. Ví dụ nó có thể nhận ra một chuyển động bất thường, một người lạ vào khu vực cấm, hoặc một tình huống cần chú ý.
Để có dữ liệu huấn luyện mô hình, Memories AI tạo ra thiết bị phần cứng tên Luci. Thiết bị này được nhân viên đeo trên người để ghi lại video trong quá trình làm việc và sử dụng thực tế. Tuy nhiên, công ty nói rõ họ không muốn trở thành nhà sản xuất phần cứng. Luci chỉ là công cụ tạm thời để thu thập dữ liệu, chứ không phải sản phẩm họ định bán đại trà. Lý do họ tự làm thiết bị này là vì chưa hài lòng với các máy quay sẵn có trên thị trường. Theo công ty, nhiều thiết bị hiện nay chỉ tập trung vào độ phân giải cao, trong khi lại tiêu tốn pin và không phù hợp cho việc ghi nhận dữ liệu dài hạn để huấn luyện AI. Một điểm đáng chú ý khác là Memories AI không chỉ làm việc với Nvidia. Công ty còn hợp tác với một số hãng công nghệ lớn khác, trong đó có Qualcomm. Theo kế hoạch, Qualcomm sẽ cung cấp chip cho các hệ thống của Memories AI từ cuối năm nay.
Chip là phần xử lý trung tâm của thiết bị, giống như “bộ não” giúp máy tính hay thiết bị hoạt động. Công ty cũng dự kiến phát triển phiên bản LVMM riêng cho smartphone, kính thực tế ảo và máy tính cá nhân. Điều này cho thấy họ muốn công nghệ của mình không chỉ dừng ở robot hay camera.
Có thể tóm gọn hướng đi của Memories AI như sau
- Họ không chỉ muốn AI “trả lời hay”, mà muốn AI “nhớ được điều nó thấy”.
- Họ tập trung vào video và hình ảnh, thay vì chỉ văn bản.
- Họ xây cả mô hình lẫn hạ tầng để dữ liệu có thể được lưu và tìm lại nhanh.
- Họ chưa bán phần cứng như một sản phẩm chính, mà dùng thiết bị tự làm để thu thập dữ liệu.
- Họ tin thị trường thiết bị đeo và robot sẽ cần công nghệ này trong tương lai.
Từ khi thành lập năm 2024, công ty đã gọi được 16 triệu USD. Số tiền này đến từ hai vòng đầu tư, gồm 8 triệu USD hồi tháng 7/2025 và thêm 8 triệu USD vài tháng sau đó. Các nhà đầu tư có Susa Ventures, Seedcamp, Fusion Fund và Crane Venture Partners. Đây là các quỹ chuyên rót vốn cho startup công nghệ giai đoạn đầu. Dù vậy, Memories AI vẫn nhìn nhận khá thận trọng về thị trường. Shawn Shen nói công ty muốn tập trung vào mô hình và hạ tầng trước, vì họ tin robot và thiết bị đeo rồi sẽ bùng nổ, nhưng “có lẽ chưa phải bây giờ”. Cách nói này khá thực tế. Nghĩa là công ty đang chuẩn bị nền móng cho một nhu cầu có thể lớn trong tương lai, thay vì vội vàng bán sản phẩm khi thị trường còn chưa thật sự sẵn sàng. Với người dùng phổ thông, điều quan trọng nhất là công nghệ này có thể khiến máy móc hiểu đời sống con người hơn.
Khi AI nhớ được cảnh vật, nó có thể giúp tìm video, quản lý kỷ niệm, hỗ trợ an ninh và điều khiển thiết bị thông minh tốt hơn. Dù vậy, đây vẫn là bài toán khó. Video rất phức tạp, dữ liệu quá lớn, và việc làm cho máy “nhớ đúng” không hề đơn giản. Vì thế, Memories AI vẫn đang ở giai đoạn xây nền tảng, chứ chưa phải một sản phẩm quen thuộc trong đời sống hàng ngày.
Vì sao nên đọc các bài tóm tắt trên Insight
Đọc tin công nghệ gốc thường mất thời gian vì có nhiều thuật ngữ, nhiều tên sản phẩm và nhiều chi tiết phụ. Insight giúp bạn rút ngắn quá trình đó bằng cách giữ lại phần quan trọng nhất, rồi diễn giải lại bằng ngôn ngữ dễ hiểu. Với những bài như thế này, bạn không cần biết AI hoạt động ra sao ở mức kỹ thuật vẫn nắm được: công ty này làm gì, vì sao đáng chú ý, và tác động thực tế có thể là gì. Đó là cách tiết kiệm thời gian hiệu quả nếu bạn muốn cập nhật tin nhanh mà không bị ngợp. Ngoài ra, tóm tắt tốt còn giúp lọc nhiễu. Thay vì đọc cả bài dài để tìm 3 ý chính, bạn có thể xem ngay bản rút gọn rồi quyết định có cần đọc sâu thêm hay không. Insight phù hợp với người bận rộn, người không chuyên công nghệ, và cả những ai muốn hiểu nhanh xu hướng mới mà không cần “dịch” quá nhiều thuật ngữ. Nói ngắn gọn: ít thời gian hơn, ít rối hơn, vẫn nắm được việc quan trọng.
Nguồn bài viết
Insight Graph
Khám phá hệ sinh thái 1997 Studio
Nếu bạn đang xây sản phẩm hoặc tăng trưởng, có thể tham khảo thêm các công cụ trong hệ sinh thái để áp dụng nhanh những insight này.
Bài liên quan





