12 min

Episode 1711 - Apr 21 - Chương 2 - Phần 3 - Các khái niệm thực tế về học máy - Vina Technology at AI time Vina Technology at AI time - Công nghệ Việt Nam thời AI

    • Business News

Chương 2 - Các khái niệm thực tế về học máy – Phần 3

(Trích từ sách Học máy cho những người ra quyết định (Machine Learning for Decision Makers, tác giả: Patanjali Kashyap - Bangalore, Karnataka, Ấn Độ) – Nhà xuất bản Apress. Lê Quang Văn dịch, giải thích và thực hiện phần kỹ thuật số.

Xin mua sách Machine Learning for Decision Makers, tiếng Anh, từ nhà xuất bản Apress, Amazon, và tại các website trên Internet hay tại các tiệm sách trong khu phố gần nhà.

Học máy: Bạn và dữ liệu của bạn

Học máy là một ngành khoa học cũ, nhưng nó đang có được động lực do tạo ra lượng dữ liệu khổng lồ từ các nguồn không đồng nhất với tốc độ nhanh chóng. Trong khi nhiều thuật toán học máy đã tồn tại trong một thời gian dài và mang di sản từ thống kê, khả năng tự động áp dụng các phép tính và logic toán học phức tạp cho dữ liệu lớn với sự trợ giúp của các phân tích phức tạp lặp đi lặp lại, nhanh hơn và nhanh hơn, là một sự phát triển gần đây.

Công nghệ liên quan đến Học máy

Phần này trình bày một số học máy phổ biến và các công nghệ liên quan và mối quan hệ của chúng. Nó sẽ giúp bạn hiểu các khái niệm quan trọng.

• Khoa học dữ liệu: Ở cấp độ rộng hơn, khoa học dữ liệu là một môn học tích hợp của khoa học toán học, thống kê và lập trình. Tuy nhiên, nó không chỉ giới hạn trong các lĩnh vực nghiên cứu và đang mở rộng sang trí tuệ nhân tạo, khoa học hành vi thống kê, công nghệ cơ sở dữ liệu, tâm lý học, xã hội học, nhận thức và khoa học thần kinh.

• Phân tích dữ liệu (data analysis): Một hoạt động điều tra. Trong phân tích dữ liệu, sau khi quét tập dữ liệu có sẵn, nhà phân tích có được thông tin chi tiết ẩn trong các tập dữ liệu.

• Phân tích dữ liệu (data analytics): Khi bạn áp dụng toán học, thống kê và thuật toán trên tập dữ liệu có sẵn để tìm ra cái nhìn sâu sắc và mối tương quan có ý nghĩa giữa chúng, quá trình này được gọi là phân tích dữ liệu(data analytics). Phân tích (analytics) là kết quả của phân tích (analysis). Trong khi đó, phân tích (analysis) là phương pháp hoặc nhóm phương pháp có thể được sử dụng để phân tích dữ liệu.

• Phân tích dự đoán: Khái niệm hóa và tạo ra một mô hình định lượng cho phép dự đoán kết quả hoặc kết quả dựa trên dữ liệu / thông tin lịch sử đáng kể có thể là một nhiệm vụ phức tạp và chuyên sâu về công nghệ. Dữ liệu đầu vào chứa nhiều biến và tất cả chúng cần được xem xét đồng thời. Một số biến này có liên quan và những biến khác có thể không quan trọng trong việc xác định kết quả. Mô hình dự đoán chi phối những hiểu biết sâu sắc từ dữ liệu có thể được trích xuất và sử dụng để đưa ra dự đoán chính xác và có liên quan trong một kịch bản nhất định. Một mô hình tốt cho phép và cởi mở với các thay đổi để nó có thể phù hợp với sự thay đổi trong các biến. Đôi khi cần phải thay đổi để tăng khả năng dự đoán. Sự thay đổi đúng đắn có thể làm tăng cơ hội đạt được kết quả mong muốn.

• Khai thác dữ liệu: Tìm các mẫu trong tập dữ liệu có sẵn. Thuật ngữ này trở nên phổ biến vào cuối những năm 90 và đầu những năm 2000 khi các tổ chức nhận ra sức mạnh của việc hợp nhất dữ liệu và cách

Chương 2 - Các khái niệm thực tế về học máy – Phần 3

(Trích từ sách Học máy cho những người ra quyết định (Machine Learning for Decision Makers, tác giả: Patanjali Kashyap - Bangalore, Karnataka, Ấn Độ) – Nhà xuất bản Apress. Lê Quang Văn dịch, giải thích và thực hiện phần kỹ thuật số.

Xin mua sách Machine Learning for Decision Makers, tiếng Anh, từ nhà xuất bản Apress, Amazon, và tại các website trên Internet hay tại các tiệm sách trong khu phố gần nhà.

Học máy: Bạn và dữ liệu của bạn

Học máy là một ngành khoa học cũ, nhưng nó đang có được động lực do tạo ra lượng dữ liệu khổng lồ từ các nguồn không đồng nhất với tốc độ nhanh chóng. Trong khi nhiều thuật toán học máy đã tồn tại trong một thời gian dài và mang di sản từ thống kê, khả năng tự động áp dụng các phép tính và logic toán học phức tạp cho dữ liệu lớn với sự trợ giúp của các phân tích phức tạp lặp đi lặp lại, nhanh hơn và nhanh hơn, là một sự phát triển gần đây.

Công nghệ liên quan đến Học máy

Phần này trình bày một số học máy phổ biến và các công nghệ liên quan và mối quan hệ của chúng. Nó sẽ giúp bạn hiểu các khái niệm quan trọng.

• Khoa học dữ liệu: Ở cấp độ rộng hơn, khoa học dữ liệu là một môn học tích hợp của khoa học toán học, thống kê và lập trình. Tuy nhiên, nó không chỉ giới hạn trong các lĩnh vực nghiên cứu và đang mở rộng sang trí tuệ nhân tạo, khoa học hành vi thống kê, công nghệ cơ sở dữ liệu, tâm lý học, xã hội học, nhận thức và khoa học thần kinh.

• Phân tích dữ liệu (data analysis): Một hoạt động điều tra. Trong phân tích dữ liệu, sau khi quét tập dữ liệu có sẵn, nhà phân tích có được thông tin chi tiết ẩn trong các tập dữ liệu.

• Phân tích dữ liệu (data analytics): Khi bạn áp dụng toán học, thống kê và thuật toán trên tập dữ liệu có sẵn để tìm ra cái nhìn sâu sắc và mối tương quan có ý nghĩa giữa chúng, quá trình này được gọi là phân tích dữ liệu(data analytics). Phân tích (analytics) là kết quả của phân tích (analysis). Trong khi đó, phân tích (analysis) là phương pháp hoặc nhóm phương pháp có thể được sử dụng để phân tích dữ liệu.

• Phân tích dự đoán: Khái niệm hóa và tạo ra một mô hình định lượng cho phép dự đoán kết quả hoặc kết quả dựa trên dữ liệu / thông tin lịch sử đáng kể có thể là một nhiệm vụ phức tạp và chuyên sâu về công nghệ. Dữ liệu đầu vào chứa nhiều biến và tất cả chúng cần được xem xét đồng thời. Một số biến này có liên quan và những biến khác có thể không quan trọng trong việc xác định kết quả. Mô hình dự đoán chi phối những hiểu biết sâu sắc từ dữ liệu có thể được trích xuất và sử dụng để đưa ra dự đoán chính xác và có liên quan trong một kịch bản nhất định. Một mô hình tốt cho phép và cởi mở với các thay đổi để nó có thể phù hợp với sự thay đổi trong các biến. Đôi khi cần phải thay đổi để tăng khả năng dự đoán. Sự thay đổi đúng đắn có thể làm tăng cơ hội đạt được kết quả mong muốn.

• Khai thác dữ liệu: Tìm các mẫu trong tập dữ liệu có sẵn. Thuật ngữ này trở nên phổ biến vào cuối những năm 90 và đầu những năm 2000 khi các tổ chức nhận ra sức mạnh của việc hợp nhất dữ liệu và cách

12 min