Ngành Khoa học dữ liệu được hiểu như thế nào?
Một ví dụ đơn giản về ứng
dụng của ngành khoa học dữ liệu, khi bạn truy cập các sàn giao dịch điện tử như
Amazon, Lazada, Tiki… khoa học dữ liệu xây dựng hệ thống từ những dữ liệu về
sản phẩm bạn đã mua, giỏ hàng của bạn, những sản phẩm bạn tìm kiếm nhiều nhất
và dữ liệu của những khách hàng đã mua sản phẩm tương tự để đề xuất thêm những
sản phẩm bổ sung. Hoạt động này mang khuyến khích bạn mua sắm, đáp ứng nhu cầu
của bạn mà không mất nhiều thời gian tìm kiếm đồng thời đem lại lợi nhuận tăng
thêm cho các sàn giao dịch này.
Năm
2012, tạp chí Harvard Business Review đã có bài báo “Nhà khoa học dữ liệu, nghề
quyến rũ nhất thế kỷ”. Gần 10 năm sau, dự báo này vẫn đúng. Sự thành công của
nhiều doanh nghiệp như Google, IBM, Apple, Netflix, Lazada, Tiki, Amazon,
Alibaba, sự tiến bộ của y học, khoa học không gian…ghi nhận sự đóng góp to lớn
của ngành khoa học dữ liệu. Cùng với cuộc cách mạng công nghệ 4.0, các doanh
nghiệp trong và ngoài nước vẫn đang “khát” nhân lực về khoa học dữ liệu.
Mức
lương của nhà khoa học dữ liệu rất hấp dẫn. Năm 2021, tại Mỹ, nhà khoa học dữ
liệu là 1 trong 10 ngành nghề có mức lương trung bình cao nhất hiện nay. Hãy
cùng khám phá ngành học khoa học dữ liệu là gì? tốt nghiệp ngành khoa học dữ
liệu sẽ làm gì? cơ hội tìm kiếm việc làm cao hay thấp? ngành khoa học dữ liệu
sẽ học nhữnng gì?
1. Ngành
Khoa học dữ liệu là gì
Theo
Mike Loukides, khoa học dữ liệu bao gồm việc thu thập, lưu trữ và kể câu chuyện
về dữ liệu đó (Data scientist involved gathering data, massaging it into a
tractable form, making it tell its story, and presenting that story to others).
Theo
Havard CS109 Khoa học dữ liệu là học
hỏi từ dữ liệu để có được những dự đoán và thông tin chi tiết hữu ích. (Learning
from data in order to gain useful predictions and insights)
Theo
Josh Blumenstock: “Một nhà khoa học dữ liệu là người biết nhiều về thống kê hơn
một nhà khoa học máy tính và biết nhiều về khoa học máy tính hơn một nhà thống
kê” (A data scientist is someone who knows more statistics than a
computer scientist and more computer science than a statistician).
Như
vậy, có thể hiểu ngành Khoa học dữ liệu là khoa học về việc thu thập và phân
tích dữ liệu, tìm ra các thức giải quyết vấn đề. Ngành học Khoa học dữ
liệu là ngành khoa học tổng hợp của 3 lĩnh vực: (1)Toán và thống kê, (2)Công
nghệ thông tin, (3)Các lĩnh vực ứng dụng cụ thể: tài chính, ngân hàng,
marketing, cơ khí- chế tạo, môi trường, y học….
2. Triển
vọng nghề nghiệp của ngành khoa học dữ liệu
2.1
Tương lai của ngành Khoa học dữ liệu
Dữ
liệu lớn (Big Data) là một trong bốn nền tảng quan trọng nhất của cuộc cách
mạng công nghệ 4.0 cùng với Internet vạn vật - IoT (Internet of Things), Trí
tuệ nhân tạo - AI (Artificial Intelligence), Chuỗi khối-Blockchain. Khoa học dữ
liệu mang lại ý nghĩa cho dữ liệu. Nó đổi dữ liệu thô thành các sản phẩm có ý
nghĩa có thể được sử dụng bởi tất cả các ngành nghề, lĩnh vực để xác định
nguyên nhân, dự báo, đưa ra các quyết định phù hợp.
Một
ví dụ về khoa học dữ liệu là thành công của Netflix - nền tảng xem phim trực
tuyến tính đến tháng 01/2021 đã có hơn 200 triệu người đăng ký trên toàn thế
giới, trong đó có 8,5 triệu người đăng ký trong quý 4-2020. Bí quyết thành công
của họ là dựa trên khoa học dữ liệu Bằng cách thu thập thông tin trên mọi tương
tác của khách hàng, Netflix có thể đi sâu vào tâm trí của người xem và có được
ý tưởng về những gì họ có thể muốn xem tiếp theo ngay cả trước khi họ kết thúc
một chương trình hoặc bộ phim. Reed
Hastings (Giám
đốc điều hành của Netflix) cho biết: “Chúng tôi có dữ liệu cho thấy có
hành vi xem khác nhau tùy thuộc vào ngày trong tuần, thời gian trong ngày,
thiết bị và đôi khi thậm chí cả vị trí. Nếu bí quyết của Starbucks là nụ cười
khi bạn nhận được ly cà phê của mình… thì của chúng tôi là trang Web điều chỉnh
theo sở thích của từng người.”
Với
việc đưa ra các sản phẩm, dịch vụ ngày càng thông minh hơn, khoa học dữ liệu là
ngành góp phần làm cuộc sống tốt đẹp hơn, có triển vọng cực lớn với nhu cầu
nhân lực không giới hạn cho hiện tại và tương lai. Bạn cũng có thể dễ dàng làm
việc tại nhiều nước do nhu cầu cao trên toàn thế giới với kiến thức, bằng cấp -
chứng chỉ ngành khoa học dữ liệu.
Năm
2021, tại Mỹ, nhà khoa học dữ liệu là 1 trong 10 ngành nghề có mức lương trung
bình cao nhất hiện nay.
|
|
||||
Rank |
Job Title |
Median Base Salary |
Job Satisfaction |
Job Openings |
|
1 |
$90,830 |
4.2 |
10,103 |
|
|
2 |
$113,736 |
4.1 |
5,971 |
|
|
3 |
$121,107 |
3.9 |
14,515 |
|
|
4 |
$131,361 |
4.0 |
10,069 |
|
|
5 |
$110,003 |
4.0 |
6,904 |
|
|
6 |
$110,000 |
4.0 |
5,621 |
|
|
7 |
$82,182 |
4.1 |
8,827 |
|
|
8 |
$94,301 |
4.1 |
4,631 |
|
|
9 |
$110,245 |
3.8 |
40,564 |
|
|
10 |
$134,122 |
4.0 |
4,315 |
|
|
Source: Glassdoor Economic Research
(Glassdoor.com/research). |
|
Tại
Việt Nam, Theo Báo cáo thị trường nhân lực ngành công nghệ thông tin
(CNTT) năm 2019 của Tập đoàn nhân sự Navigos, mức lương trung bình của người
làm Khoa học dữ liệu liên quan đến AI là 1.844 USD/tháng (tương đương 43 triệu
đồng). Theo Topdev. mức
lương của một nhà khoa học dữ liệu lên đến 500-600 triệu/tháng..
2.2
Các công việc cụ thể cho ngành khoa học dữ liệu
Trong một nghiên cứu của O'Reilly, một
trong những nhà phát hành chuyên về mảng công nghệ và khoa học máy tính, có 4 dạng
nhà khoa học dữ liệu (Data Scientist) tiêu biểu.
1.
Doanh nhân (Data Businesspeople)
Quan
tâm vào sản phẩm và phát triển lợi nhuận, họ là các nhà lãnh đạo, nhà quản lý
và doanh nhân có sự am hiểu về mặt kỹ thuật. Đa phần đều có nền tảng giáo dục
xuất phát bằng kỹ sư kết hợp với một bằng MBA. Các lãnh đạo doanh nghiệp khởi
nghiệp trong công nghệ có kiến thức về khoa học dữ liệu là một lợi thế lớn.
2. Nhà sáng tạo (Data Creatives)
Điểm
nhấn thường thấy là sự xuất sắc sử dụng các công nghệ minh họa (Visualization
Techonology) và mã nguồn mở. Họ có khả năng giải
quyết toàn bộ quá trình phân tích từ đầu đến cuối của quá trình xử lý số liệu:
từ trích dữ liệu, đến tổng hợp và phân lớp dữ liệu, đến trình bày các
phân tích dưới dạng thống kê hay các dạng tiên tiến khác, đến tạo ra cách diễn
giải và sự hình dung thuyết phục, đến xây dựng các công cụ khiến cho sự phân
tích có khả năng phát triển và ứng dụng rộng rãi trong các lĩnh vực. Nhà sáng
tạo khoa học dữ liệu thường có cái nhìn bao quát, kỹ năng thành thạo và kinh
nghiệm phong phú.
3. Nhà phát triển (Data Developers)
Tập
trung vào việc viết phần mềm để làm phân tích, thống kê, và nhiệm vụ học máy,
thường xuyên trong môi trường sản xuất. Có thể nói, họ giải quyết các vấn
đề kỹ thuật của khoa học dữ liệu - làm thế nào để có được dữu liệu, làm thế nào
để lưuư trữ dữ liệu và khai thác dữ liệu. Họ
thường có trình độ khoa học máy tính, và thường xuyên làm việc với “dữ liệu
lớn" (Big Data).
4. Nhà nghiên cứu (Data Researchers)
Đó
là những người áp dụng những kỹ năng được đào tạo trong khoa học cùng với các
công cụ và kỹ thuật để nghiên cứu học thuật chuyên sâu.
Thực
tế theo định hướng của nhiều Trường, sau khi tốt nghiệp ngành khoa học dữ liệu,
bạn có thể trở thành nhà khoa học dữ liệu theo 4 hướng trên hoặc trở thành:
5. Nhà phân tích dữ liệu (Data Analyst)
Chuyên viên phân tích dữ liệu trong các lĩnh vực như tài
chính, tiếp thị, bảo hiểm, truyền thông, chăm sóc sức khỏe ... Bạn có thể bắt
đầu với những công việc đơn giản nhất như thu thập, quản lý, trích xuất, phân
tích hay lọc dữ liệu theo yêu cầu của các bên liên quan.
Có thể hiểu không phải nhà phân tích dữ liệu nào cũng có thể
trở thành nhà khoa học dữ liệu nhưng nếu mục
tiêu nghề nghiệp của bạn là trở thành một nhà khoa học dữ liệu thì việc
thành thạo các kỹ năng phân tích dữ liệu là yêu cầu cơ bản mà bạn nhất định
phải đáp ứng được. Trở thành Nhà khoa học dữ liệu đòi hỏi kỹ năng cao hơn về
toán học, thống kê và việc xây dựng các mô hình.
2.3
Các vị trí đảm nhận sau khi tốt nghiệp ngành khoa học dữ liệu
-
Nghiên cứu trong các viện, trường đại học, các dự án, hỗ trợ các nhóm nghiên
cứu trong nhiều lĩnh vực.
-
Làm việc cho các tập đoàn, công ty trong và ngoài nước ở bộ phận quản trị dữ
liệu, chuyên viên phân tích dữ liệu, tham gia sản xuất phần mềm. Trong đó, hiện
nay các tập đoàn viễn thông, thương mại điện tử, công nghệ thông tin, các công
ty phân phối sản phẩm đang rất thiếu nhân lực khoa học dữ liệu.
-
Làm việc trong các cơ quan nhà nước bộ phận quản trị dữ liệu, chuyên viên phân
tích dữ liệu.
-
Sau khi tích lũy đủ kinh nghiệm và kiến thức, trở thành nhà khoa học dữ liệu
với 4 hướng như O'Reilly đã đề cập ở trên.
3.
Các tố chất cần có để
thành công trong lĩnh vực Khoa học Dữ liệu
-
Khả năng logic tốt:
-
Không ngại tìm tòi, đặt câu hỏi khó
-
Khả năng tập trung, cẩn thận, chú ý đến chi tiết
-
Khả năng tiếng Anh: hầu hết các tài liệu đều bằng tiếng Anh.
-Khả
năng làm việc nhóm
Riêng
đối với lĩnh vực Phân tích dữ liệu. Không yêu cầu phải thực sự siêu sao toán
học hay tốt nghiệp từ những chuyên ngành về Data Analysis vẫn có thể trở thành
một nhà phân tích dữ liệu thành công.
4.
Một số thách thức trong ngành khoa học dữ liệu
4.1.Vai
trò cụ thể của nhà khoa học dữ liệu phụ thuộc vào lĩnh vực mà công ty chuyên về
hoặc tùy từng dự án mà vai trò của nhà khoa học dữ liệu sẽ khác nhau.
4.2.
Các kiến thức, kĩ năng về công nghệ thông tin, thống kê luôn không ngừng đổi
mới.
4.3
Yêu cầu về kiến thức nhất định trong lĩnh vực mà công ty hoặc dự án đang thực
hiện như dầu khí, giáo dục, y dược….
4.4
Các quy định về việc bảo vệ dữ liệu có thể trở thành rào cản trong việc thu
thập dữ liệu.
Những
thách thức trên có thể vượt qua nếu chúng ta có sự kiên trì, không ngừng học
hỏi, trang bị thêm các kiến thức nền và kĩ năng làm việc nhóm.
Một
chia sẻ đến từ một Data Scientist chuyển sang làm Data Engineer
Hàng
năm, trên thế giới có khoảng 12 cuộc thi lớn về khoa học dữ liệu. Các sinh
viên, người trong ngành tham gia để học hỏi, tìm đồng đội, khẳng định năng lực
và tìm cơ hội việc làm, hợp tác
5.
Ngành Khoa học dữ liệu học gì
Chương
trình đào tạo xoay quanh 3 mảng chính: (1) khoa học máy tính, (2)toán học và thống kê, (3 )kiến thức
chuyên sâu về các công cụ xây dựng, quản trị, phân tích và phát triển các hệ
thống dữ liệu, ứng dụng của khoa học dữ liệu trong một số lĩnh vực.
Lời khuyên: Khoa
học dữ liệu là một lĩnh vực rộng lớn, bạn nên định hướng chuyên sâu cho
mình để có thể đào sâu hơn qua việc học các môn học tự chọn, học thêm các chứng
chỉ quốc tế, các kiến thức bổ trợ, chọn đơn vị làm thêm-thực tập. Một thuận lợi
lớn cho các bạn sinh viên là các ông lớn công nghệ như Google, IBM, Microsoft
đều có các lớp học, cấp chứng chỉ trực tuyến từ cơ bản đến nâng cao.