
Khái niệm Big Data hình thành và tồn tại như thế nào? Nó ảnh hưởng gì đến môi trường kinh doanh trong nền kinh tế tri thức toàn cầu? Loạt bài sau sẽ giải thích cho các quý độc giả.
Big Data là gì?
Đối với những phát triển gần đây của Big Data, không thể dùng 2 từ “cách mạng” đơn thuần để miêu tả, chỉ có thể liên tưởng sự phát triển này với các cuộc khai phá địa lý vĩ đại trong lịch sử nhân loại, hay cuộc cách mạng công nghiệp mang tầm vóc lớn lao đủ để thay đổi lịch sử văn minh loài người, những chân trời mới của nhân loại mới có thể hiểu được tầm vóc của nó. Ngược dòng lịch sử một chút, vào thập niên 60 máy tính bắt đầu được áp dụng trong các xí nghiệp, thập niên 70 máy tính cá nhân dần được phát triển, sự ra đời của mạng internet đánh dấu việc xã hội loài người tiến nhập thời đại kỹ thuật số. Thời đại huy hoàng nhất của máy tính đang tới gần, điện toán đám mây; những cơ sở dữ liệu siêu khổng lồ; “Internet of things” nơi mọi thứ có điện đều được kết nối với nhau, những phát kiến về công nghệ đang dần thay đổi giá trị quan, nhân sinh quan, kinh doanh quan của chúng ta kể từ thời cách mạng công nghiệp đến nay. Giáo sư Tian Su Ning cho rằng, mạng internet không chỉ đơn giản là một sản phẩm kỹ thuật, nó là một thế lực mới đang định hình xã hội hiện đại, định hình nên các phương thức cạnh tranh trong tương lai, không chỉ thế nó còn đang góp phần định hình nên tư duy và giá trị quan của chính con người sử dụng nó. Những nguồn lực mạnh nhất trong một xã hội công nghiệp bao gồm điện lực; giao thông; dầu hỏa; hóa chất; v.v. Còn trong xã hội hậu công nghiệp, xã hội công nghệ thì mạng di động, điện toán đám mây, cơ sở dữ liệu, trí thông minh nhân tạo mới là những nguồn lực chủ yếu tạo nên sự khác biệt.
Sự khác biệt nằm ở đâu?
Rút cuộc cuộc cách mạng “big data” khác biệt ở điểm nào? Số liệu đã sớm có mặt trong cuộc sống của con người từ khi con người khám phá ra những con số và toán học, nhưng thời điểm huy hoàng nhất của số liệu chính là thời đại hiện nay khi công nghệ hiện đại cho phép con người có thể thu thập một số lượng cực kỳ lớn thông tin trong khoảng thời gian cực ngắn với mức độ xử lý chính xác cao, cộng với sự trợ giúp của internet giúp cơ sở dữ liệu siêu khổng lồ ấy không ngừng được xây dựng lớn mạnh thông qua việc chia sẻ thông tin giữa người với người ở mọi ngóc ngách trên hành tinh miễn là nơi ấy được nối mạng. Cuộc “thập tự chinh” dữ liệu big data bắt đầu với cuộc cách mạng máy tính, sau khi các con số nhị phân mã hóa 0-1 xuất hiện, những cỗ máy vi tính với kích thước siêu khủng lúc ban đầu được sử dụng trong lĩnh vực quân sự, nhiệm vụ của những chiếc máy IBM khổng lồ thế hệ đầu tiên này là xử lý những số liệu data structure (số liệu kết cấu).
Giải thích một cách đơn giản, nhờ vào việc phân tích những dữ liệu này giúp máy tính nhận biết được, “bạn đang làm gì vào lúc nào”, được áp dụng sớm nhất trong lĩnh vực ngân hàng và điều tra dân số. Bao nhiêu tuổi, ở nơi nào, ai đã tiêu bao nhiêu tiền, tiết kiệm được bao nhiêu, ai đang gọi điện thoại, gọi cho ai, gọi trong bao nhiêu lâu…những số liệu này chiếm lĩnh hầu như toàn bộ khả năng xử lý của máy chủ trong suốt ba bốn chụn năm từ thời những cỗ máy IBM thế hệ đầu tiên ra đời. Nếu so sánh với cơ sở dữ liệu mà một máy chủ ngày nay cần phải xử lý thì những số liệu này chỉ là những con số nhỏ.
Sự tồn tại và ứng dụng của “Big Data”:
Vào thời điểm nào cuộc cách mạng số liệu như chúng ta thấy ngày nay đã xuất hiện? Tùy theo sự phát triển không ngừng nghỉ của công nghệ máy tính và sự phủ sóng của internet, dữ liệu thông tin như chúng ta biết cách đây 30, 40 năm đã xảy ra rất nhiều biến hóa, ngày nay ngoài dữ liệu kết cấu (structure data) người ta còn biết đến một dạng khác của dữ liệu, tạm gọi là “dữ liệu chia sẻ”. Số liệu này ghi lại toàn bộ hoạt động trực tuyến, bao gồm đăng tải status, chia sẻ hình ảnh, comment, bình luận, nhắn tin…của chúng ta, những tín đồ mạng xã hội. Về bản chất loại dữ liệu này khác hẳn với dạng dữ liệu kết cấu, nếu nói structure data là dữ liệu “tĩnh” thì “dữ liệu chia sẻ” là dữ liệu “động”, nó được sản sinh qua quá trình chia sẻ thông tin trực tuyến liên tục của người sử dụng. Tóm lại, chính sự xuất hiện của mạng internet, thương mại điện tử, gần đây nhất là cơn bão mạng xã hội đã tạo nên những dạng thức dữ liệu mới này, trong tương lai người ta sẽ còn phải đón nhận thêm nhiều loại dữ liệu thông tin nữa, vì mọi thiết bị điên tử sẽ đều có thể kết nối mạng (Internet of things), mọi thứ sẽ được “smart hóa” từ điện thoại, máy ảnh, tivi, tủ lạnh cho đến cả dao cạo râu, và chúng sẽ liên tục sản sinh ra thêm nhiều loại dữ liệu số hóa nữa. Trong tương lai, cơ sở dữ liệu được cấu thành bởi 3 dạng thức thông tin cơ bản, số liệu kết cấu data-structure, dữ liệu chia sẻ, và dữ liệu quan trắc.
Theo Một thế giới.
Xem bài gốc tại đây.