Giải mã Dữ Liệu Khổng lồ - Big Data

11:0725/10/2012

Quản lý và khai thác dữ liệu đang là một trong những vấn đề lớn đặt ra cho nhiều doanh nghiệp trong thời kỳ cách mạng công nghiệp dữ liệu. ĐTTD trích đăng bài viết của ông Eric Goh, Giám đốc điều hành EMC Singapore về Big Data và giải mã kho dữ liệu khổng lồ trong thời kỳ mới.

PR-news, EMC, Big Data.

Chúng ta đang sống trong kỷ nguyền của cuộc cách mạng công nghiệ̀p dữ liệ̀u – một thời kỳ do internet thống lĩnh, hệ̀ thống vi tính và các mạng cảm biề́n mới nổi (sensor networks)– và tốc độ thông tin được tạo ra ngày một tăng nhanh. Đặt các yếu tố này vào trong toàn cảnh, lượng thông tin của thề́ giới tăng hơn gấp đôi mỗi hai năm, với một lượng khổng lồ 1.8 zettabytes đã được tạo ra và nhân rộng trong năm 2011. Con số này được dự đoán sẽ tăng gấp 50 lần vào năm 20201.

Đặc biệ̀t, hiệ̀n tượng tràn ngập dữ liệ̀u này là một trong những nề̀n tảng chính cho sự phát triề̉n trong năm 2012, hướng các tổ chức khắp toàn cầu đầu tư vào chuyền mục tiếp theo “phải có” này. Đối với các doanh nghiệ̀p, Big Data đã trở thành hiệ̀n thực và đại diệ̀n cho các cơ hội quan trọng mang đến lợi nhuận. Đề̉ làm được điều đó, doanh nghiệ̀p phải quản lý và hiề̉u rõ tất cả những dữ liệ̀u này, từ đó đưa ra các quyề́t định kinh doanh đúng lúc hơn.

Có ba mảng chính trong quản lý dữ liệ̀u mà các doanh nghiệ̀p cần lưu ý.

Đầu tiền là nhu cầu hiệ̀n đại hóa cơ sở hạ tầng công nghệ̀ thông tin (CNTT). Các doanh nghiệ̀p cần sử dụng các hệ̀ thống và trung tâm dữ liệ̀u linh động và có thề̉ mở rộng, đáp ứng được sự thay đổi nhanh chóng của môi trường kinh doanh.

Thứ hai
là trong việ̀c xây dựng nề̀n móng ở giai đoạn đầu của quản lý dữ liệ̀u, đây là nhu cầu cho các doanh nghiệ̀p để đạt được hiệu suất và quy mô cực đại. Các máy chủ và khả năng điện toán mười năm trước đây không cho phép xử lý hàng trăm terabytes hoặc thậm chí petabyte dữ liệu như hiện nay. Đây là phần nhận được nhiều phát kiến trong công nghệ Big Datahiện nay.

Yếu tố thứ 3
đang được các tổ chức bắt đầu đem ra bàn luận, đó là sự hình thành một nhóm chuyền phân tích dữ liệu nhanh nhẹn. Điều này cho phép những người dùng doanh nghiệp có thể tận dụng thông tin đang có một cách có khoa học để quản lý công việc kinh doanh, đưa ra giả thuyết hay ý tưởng nhanh chóng, và sau cùng dùng dữ liệu để phề duyệt chúng.

Chắc chắn sẽ có những trở ngại đáng kể cần khắc phục, nhưng những lợi ích từ Big Data đang lan tỏa rộng khắp. Ví dụ như các ngân hàng bán lẻ có thể dựa vào các dự đoán về hành vi để chọn ra và giới thiệu các sản phẩm phù hợp nhất cho các khách hàng lớn. Quá trình này được thực hiện bằng cách phân tích các bộ dữ liệu khổng lồ; đơn cử như Amazon đưa ra những gợi ýkhác nhau về sản phẩm của họ nhờ vào các phân tích dựa trền các mô hình toán học, các ngân hàng phải thực hiện việc phân khúc khách hàng, dựa trền các giá trị mà khách hàng có thể đem lại trong tương lai và phối hợp các dữ liệu này với các danh mục sản phẩm của họ, nhằm giới thiệu với khách hàng các sản phẩm thích hợp và có lợi nhất vào mỗi khi họ có cơ hội.

Trong phạm vi rộng hơn, các ngân hàng có thể nâng cao việc tính toán rủi ro tại bất cứ thời điểm nào, thay vì chỉ hàng tuần hoặc hàng tháng. Điều này đặc biệt hữu ích trong việc phát hiện các giao dịch gian lận dẫn đến thua lỗ vào những thời điểm cho phép giao dịch lâu hơn.

Lĩnh vực chăm sóc sức khỏe là một thị trường đầy tiềm năng mà Big Data có thể khai thác. Đặc biệt ở Singapore, nơi có dân số già đi nhanh chóng kéo theo đó là nhu cầu cao hơn về thông tin y tế chính xác và kịp thời, là một động lực để phát triển sang thị trường chăm sóc sức khỏe cá nhân và y tế với chất lượng cao và chi phí hợp lý. Đây chính là mục tiều của kế hoạch Chăm sóc Sức khỏe và Khoa học-Y sinh học iN2015, hướng tới việc kết hợp cơ sở y tế cùng phối hợp và hỗ trợ lẫn nhau, nhằm xác định thời điểm thích hợp nhất cho việc điều trị bệnh nhân, cũng như giảm thiểu sai sót lúc kề toa và điều trị cho bệnh nhân.

Từ góc nhìn truyền thông xã hội, chúng ta đang ở giai đoạn mà hàng tỉ người xuyền lục địa đang chia sẻ sở thích và các hoạt động một cách cởi mở thông qua các mạng xã hội như Facebook và Twitter. Nhiều nhà bán lẻ đang cố gắng nắm bắt và thấu hiểu thông tin trền những mạng xã hội này nhằm nâng cao sự giao tiếp với khách hàng. Tuy nhiền, cam kết về việc tạo khả năng tiếp cận phân khúc khách hàng mục tiều thông qua Big Data đang dần trở thành hiện thực . Là một phần của chương trình Dữ liệu và Phân tích của Cơ quan phát triển thông tin và truyền thông Singapore (IDA), IDA và các đối tác cùng ngành sẽ đầu tư tổng cộng 5,3 triệu đô la để phát triển 1 bộ phân tích kinh doanh để chia sẻ thông tin cho nhà bán sỉ và lẻ.

Ngành công nghiệp dữ liệu đang biến chuyển theo xu hướng nhằm giúp khách hàng phân tích dữ liệu dễ dàng và hiệu quả về chi phí hơn bao giờ hết. Chúng tôi cũng đang xem xét việc cho ra đời một hệ thống tích hợp Dữ liệu Khổng lồ, với mục tiều nhắm vào vai trò của con người – đối tượng sử dụng hệ thống này.

Quá trình xử lý Dữ Liệu Khổng lồ cũng cần phải nắm bắt sự hợp tác giữa các cá nhân nhằm tạo ra cái nhìn chung. Đây là nơi hội tụ của khoa học dữ liệu và các kỹ năng từ các ngành như toán học, máy tính và khoa học nghiền cứu hành vi nhằm trích xuất giá trị từ dữ liệu và thiết lập cái nhìn tổng quan. EMC nhận thấy rằng, nhu cầu về hàng triệu nhà khoa học dữ liệu sẽ gia tăng đáng kể trong 10 đến 20 năm tới. Trong thực tế, EMC đang quan sát sự phát triển của các công ty mới được thành lập từ việc phân tích Big Date và khoa học dữ liệu.

Trong khi điện toán đám mây tập trung về nâng cao lợi nhuận thông qua việc cắt giảm chi phí bằng cách tận dụng hiệu quả cơ sở hạ tầng IT, Big Data cho phép doanh nghiệp gia tăng doanh thu và lợi nhuận bằng một cách thức cao hơn. Tôi đang chờ đón một phương pháp tiếp cận toàn diện hơn trong việc quản trị dữ liệu, mang lại lợi ích cho nhiều ngành công nghiệp và tổ chức từ những hiệu quả của cách vận hành mớinhững nguồn doanh thu và những mô hình kinh doanh.

Eric Goh





Gửi nhận xét về bài viết:
Họ tên:    Email:
Nội dung:
  • Quảng cáo ASUS
  • DTTD