1.   Data Mining – Khai phá dữ liệu

Đây là quá trình tính toán, sắp xếp lượng dữ liệu khổng lồ một cách tự động, từ đó xác định xu hướng, mô hình hóa dữ liệu và thiết lập các mối quan hệ, thống kê hướng tới mục tiêu chính là trích xuất thông tin từ một bộ dữ liệu rồi chuyển nó thành một cấu trúc dễ hiểu, có thể sử dụng được.

Data Mining được sử dụng nhiều trong các lĩnh vực như Tài chính, Nhân sự, Marketing,…Riêng với lĩnh vực Công nghệ thông tin, người ta thường vận dụng Data Mining để thu thập, phân tích và xử lý các dữ liệu ứng dụng, cơ sở hạ tầng hay hệ thống mạng. Từ đó hiểu thêm về bảo mật hệ thống hay hiệu suất mạng.

  1.   Natural Language Processing (NLP) – Xử lý ngôn ngữ tự nhiên

Các loại ngôn ngữ chúng ta dùng để trao đổi, giao tiếp trong đời sống hàng ngày như tiếng Việt, tiếng Anh, tiếng Pháp, tiếng Hoa… được gọi là ngôn ngữ tự nhiên (Natural Language). Còn các loại ngôn ngữ chúng ta dùng để xử lý các loại công việc trên máy như ngôn ngữ lập trình, ngôn ngữ máy,… được gọi là ngôn ngữ nhân tạo. Vì thế, ta có thể hiểu đơn giản NLP là thuật ngữ được dùng để chỉ các phương pháp, cách thức về kỹ thuật giúp thể hiện ngôn ngữ tự nhiên trong môi trường máy tính.

Các bước xử lý có thể được tiến hành lần lượt hoặc cùng lúc tùy thuộc vào từng trường hợp và phương pháp nhưng thường bao gồm 5 phần cơ bản:

Phân tích và bóc tách các loại từ ngữ, các loại ký tự không phải chữ.

Phân tích cú pháp câu, cân nhắc tính liên kết và đối chiếu văn phạm chuẩn.

Phân tích để xử lý phần ngữ nghĩa vào cấu trúc nói trên.

Xử lý tích hợp văn bản làm ra sự liên kết giữa các cậu rời rạc.

Xử lý phân tích thực nghĩa mang lại ý nghĩa chuẩn xác cho câu từ.

Những ứng dụng của xử lý ngôn ngữ tự nhiên NLP trong cuộc sống hàng ngày bao gồm nhận dạng chữ viết, nhận dạng tiếng nói, tổng hợp tiếng nói, tính năng dịch tự động hay tìm kiếm thông tin, tóm tắt văn bản…

  1.   Pattern Recognition – Nhận dạng mẫu

Đây được xem là một tập hợp các phương pháp học có giám sát hay còn gọi là supervised learning. Nói một cách đơn giản, nhận dạng mẫu chính là việc máy sẽ thực hiện một tác động vào dữ liệu thô có sẵn với mục đích phân loại chúng. Tuy nhiên, tác động nói trên cụ thể là gì và như thế nào thì phải tùy thuộc vào từng loại dữ liệu. Việc phân loại này thường được tiến hành dựa trên kiến thức hoặc thông tin được trích xuất từ các bộ dữ liệu sẵn có.

Các ứng dụng cụ thể của Pattern Recognition có thể kể tới gồm nhận dạng tiếng nói tự động, phân loại thư rác trong hòm thư điện tử, nhận dạng mã bưu điện tự động viết tay trên bì thư hay xác nhận danh tính dựa trên khuôn mặt.

  1.   Expert Systems – Hệ chuyên gia

Hệ chuyên gia là chương trình công nghệ mang tính chất của hệ cơ sở tri thức, được thiết kế để giải quyết mọi vấn đề liên quan đến lý luận tri thức trong một lĩnh vực hay ứng dụng cụ thể nào đó.

Mỗi Expert Systems sẽ xử lý công việc như một chuyên gia thực sự trong những lĩnh vực như Kế toán, Tư vấn tài chính hay Nhân sự,…

Các hệ chuyên gia sẽ xử lý vấn đề với hai thành phần chính gồm:

Cơ sở tri thức: đây là khu vực bao gồm sự kiện và luật lệ giúp lưu trữ và biểu diễn các tri thức liên quan đến lĩnh vực mà hệ đảm nhận, đồng thời, đây cũng là cơ sở cho mọi hoạt động của hệ.

Động cơ/máy suy diễn: đây là quá trình đưa ra kết luận về vấn đề đang giải quyết thông qua hình thức cho phép tri thức sẵn có ở phần cơ sở tri thức về lĩnh vực liên quan được khớp với các sự kiện sẵn có trong vùng nhớ.