Xu hướng phát triển của AI-a-a-S trên nền Public Cloud

Làn sóng điện toán đám mây đầu tiên được tập trung vào các nền nền tảng, Google App Engine, Engine Yard, Heroku, Azure được phân phới tới các developers dưới dạng Dịch vụ (PaaS). Điều lớn tiếp theo trong đám mây là Cơ sở hạ tầng như một Dịch vụ nơi khách hàng có thể tự cung cấp máy ảo và lưu trữ. Làn sóng thứ ba của đám mây tập trung xung quanh dữ liệu. Từ các cơ sở dữ liệu quan hệ đến Big Data tới các cơ sở dữ liệu đồ thị, các nhà cung cấp cloud cung cấp các dịch vụ nền tảng dữ liệu bao gồm một loạt các dịch vụ. Cho dù đó là AWS hay Azure hay GCP, tính toán, lưu trữ và cơ sở dữ liệu là những con bò sữa hái ra tiền cho dịch vụ public cloud.

Làn sóng tiếp theo sẽ thúc đẩy sự phát triển của đám mây công cộng là trí thông minh nhân tạo. Các nhà cung cấp dịch vụ đám mây đang cố gắng cung cấp một khía cạnh công nghệ khác toàn diện, AI as a Service

Bảng stack của AI trong Public Cloud

AI Infrastructure

Các mô hình học máy được tạo ra khi một lượng lớn dữ liệu được áp dụng cho các thuật toán thống kê. Các mô hình này học hỏi từ nhiều mẫu khác nhau từ dữ liệu hiện có. Càng có nhiều dữ liệu thì độ chính xác của dự đoán càng tốt. Ví dụ, hàng chục nghìn báo cáo X quang được sử dụng để đào tạo mạng lưới deep learning, sẽ phát triển các mô hình để phát hiện các khối u. Không phân biệt ngành dọc và vấn đề kinh doanh, việc machine learning cần dữ liệu có thể ở nhiều dạng. Cơ sở dữ liệu quan hệ, dữ liệu phi cấu trúc được lưu trữ dưới dạng đối tượng nhị phân, chú thích được lưu trữ trong cơ sở dữ liệu NoSQL, dữ liệu thô được nhập vào các data pool hoạt động như đầu vào cho các mô hình machine learning.

Deep learning và neutral network – kỹ thuật tiên tiến của machine learning- thực hiện các tính toán phức tạp đòi hỏi sự kết hợp giữa CPU và GPU. Bộ xử lý đồ họa bổ sung cho CPU thông qua các phép tính nhanh hơn. Trong bối cảnh hiện tại, GPU đắt hơn CPU. Các nhà cung cấp dịch vụ đám mây đang cung cấp các cụm máy ảo và container được hỗ trợ bởi GPU thông qua mô hình trả tiền theo từng lần sử dụng (PAYG). Với dữ liệu nằm trên cloud, người ta hoàn toàn có thể xây dựng hạ tầng tính toán để training các mô hình machine learning.

Một khi các mô hình học máy được đào tạo, chúng được triển khai tới các VM và container để suy luận. Ví dụ cơ sở hạ tầng được cung cấp bởi IaaS cung cấp khả năng tính toán trên web, để xử lý các phân tích dự báo trong sản xuất.

AI Services

Các nhà cung cấp Public Cloud đã và đang phát triển  các API và các dịch vụ có thể được sử dụng mà không cần tạo các mô hình machine learning. Các dịch vụ này tận dụng lợi thế của cơ sở hạ tầng cơ sở thuộc sở hữu của các nhà cung cấp cloud.

Các API tính toán nhận diện, như thị giác, lời nói, bản dịch, phân tích văn bản và tìm kiếm có sẵn dưới dạng các REST endpoint cho các developer. Chúng có thể được tích hợp dễ dàng với các ứng dụng chỉ với một cuộc gọi API.

Mặc dù việc tính toán nhận diện (cognitive computing) mang lại sức mạnh của AI thông qua các API, nhưng nó chỉ có thể xử lý các trường hợp chung chung. Để cho phép khách hàng tận dụng các lợi ích của thuật toán nhận diện dựa trên các bộ dữ liệu tùy chỉnh, các nhà cung cấp dịch vụ cloud đang di chuyển theo hướng cho phép người dùng tuỳ chỉnh thuật toán nhận diện. Trong mô hình này, khách hàng mang dữ liệu riêng của họ để đào tạo các dịch vụ nhận diện để cung cấp các dịch vụ chuyên biệt, thích hợp.

Các trợ lý số (như Siri, Cortana, Google Assistant…) là một ứng dụng lớn, rất phổ biến với người dùng cuối. Để cho phép các developer tích hợp các ứng dụng thoại thoại và văn bản, các nhà cung cấp dịch vụ cloud lớn đã offer dịch vụ chat bot. Bằng cách sử dụng dịch vụ này, các nhà phát triển web và thiết bị di động có thể dễ dàng thêm trợ lý ảo vào ứng dụng của họ.

AI Tools

Apart from offering the APIs and infrastructure, cloud providers are competing to build tools for data scientists and developers. These tools are tightly integrated with the data platform and compute platform, which will indirectly drive the consumption of VMs, containers, storage, and databases.

Ngoài việc cung cấp các API và cơ sở hạ tầng, các nhà cung cấp cloud đang cạnh tranh để xây dựng các công cụ cho các nhà khoa học và nhà phát triển dữ liệu. Những công cụ này được tích hợp chặt chẽ với nền tảng dữ liệu và nền tảng tính toán (compute platform), sẽ gián tiếp thúc đẩy việc sử dụng máy ảo, lưu trữ và cơ sở dữ liệu.

Vì việc thiết lập và cài đặt môi trường khoa học dữ liệu rất phức tạp, các công ty dịch vụ cloud cung cấp các mẫu VM template được cấu hình sẵn đi kèm với các framework phổ biến như TensorFlow, Microsoft CNTK, Apache MXNet, Caffe và Torch.

The efficiency of a machine learning model squarely depends on the data quality. To facilitate this, public cloud providers are offering data preparation tools that do the extract, transform, load (ETL) job. The output of these ETL jobs is fed to machine learning

Hiệu quả của một mô hình machine learning phụ thuộc vào chất lượng dữ liệu. Để tạo thuận lợi cho điều này, các nhà cung cấp public cloud đang cung cấp các công cụ để thực hiện công việc trích xuất (extract), chuyển đổi (transfer), tải (load) (ETL) dữ kiệu. Đầu ra của các công việc ETL này được cung cấp cho Machine learning.

Các nhà cung cấp dịch vụ public cloud đang đầu tư vào AI để thu hút khách hàng đến nền tảng của họ. AI dùng trong public cloud vẫn đang phát triển, nhưng nó trở thành một trình điều khiển thiết yếu cho việc áp dụng các dịch vụ tính toán và dữ liệu sau này.

(.Theo Forbes)