Trực quan hóa dữ liệu (data visualization) – thể hiện dữ liệu/thông tin thành biểu, đồ thị hoặc về định dạng trực quan hoá dữ liệu khác – đóng vai trò rất quan trọng trong mọi lĩnh vực. Mục đích là truyền thông tin rõ ràng và hiệu quả cho người sử dụng thông qua đồ họa được lựa chọn như bảng biểu hoặc biểu đồ. Với sự gia tăng của dữ liệu lớn như ngày nay, mỗi doanh nghiệp cần có những khả năng phân tích đến dữ liệu ngày càng lớn. Và mục đích của phân tích dữ liệu là sẽ tìm thấy những insight ẩn sau dữ liệu, thêm vào đó dữ liệu sẽ có những giá trị hơn nhiều khi được trực quan. Ngay cả khi với một nhà phân tích dữ liệu sẽ có thể phát hiện đến những insight mà không cần trực quan hoá dữ liệu, nhưng sẽ khó khăn để họ có thể truyền đạt được ý nghĩa cho mỗi khách hàng, đồng nghiệp hiểu. Biểu đồ và đồ thị giúp truyền đạt được những dữ liệu dễ dàng hơn.
Có nhiều công cụ trực quan hóa hỗ trợ người dùng sử dụng tùy thuộc vào nhu cầu người sử dụng: Google Data Studio (công cụ này đã được giới thiệu ở một bài blog khác), Tableau, Loocker, Infogram, D3.js, FusionCharts, Datawrapper, Sisense, Microsoft Power BI, HighCharts, Superset, …
Hiện nay, phòng Giải pháp đang sử dụng Microsoft Power BI – Power BI Desktop cho các mục đích như: thống kê phát hiện bất thường dữ liệu, xây dựng báo cáo tự động cho các campaign, báo cáo meeting hàng tuần, …
Giới thiệu về Power BI Desktop
Power BI là một sản phẩm ứng dụng văn phòng – nhóm Kinh doanh thông minh (Business Intelligence) và đang có trên 3 nền tảng: website, desktop và mobile.
Power BI có 3 đặc điểm nổi bật:
- Kết nối, transform và phân tích dữ liệu lớn: truy cập dữ liệu hầu như mọi nơi (database tables, flat files, cloud services, folders, …) và tạo ra các quy trình data shaping và tải dữ liệu (ETL) một cách tự động
- Xây dựng relationship models để kết hợp dữ liệu từ nhiều nguồn
- Xác định các phép tính phức tạp bằng Data Analysis Expressions (DAX)
Power BI gồm 4 thành phần chính:
- Power BI Desktop (đây là thành phần sẽ được giới thiệu chính trong Blog): có vai trò xử lý, tập hợp, kết nối với nhiều nguồn dữ liệu khác nhau và xây dựng mô hình dữ liệu dùng để trực quan hóa cho các báo cáo. Đây là một phần mềm trên hệ điều hành Windows. Mô hình dữ liệu này cho phép bạn xây dựng các bảng dữ liệu kết nối và biểu đồ từ đó có thể chia sẻ dưới dạng báo cáo với những người khác trong tổ chức của bạn
- Power BI Apps: cũng là Power BI nhưng lại ở dạng ứng dụng để có thể sử dụng trên các tảng như Android hay iOS
- Dịch vụ đám mây Power BI Service (Power BI Online): đây là một dịch vụ lưu trữ dữ liệu của Power BI cho phép người dùng lưu trữ báo cáo, dashboard mọi lúc mọi nơi
- Power BI Report Server: người dùng có thể xuất bản báo cáo sau khi hoàn thành lên hệ thống Power BI Server của công ty
Hầu hết người dùng làm việc trong các dự án kinh doanh thông minh sử dụng Power BI Desktop để tạo báo cáo, sau đó sử dụng Power BI Service để chia sẻ báo cáo của họ với những người khác
Cách cài đặt Power BI Desktop
Truy cập vào powerbi.microsoft.com và ấn “Download Free” để bắt đầu download Power BI Desktop
Bạn không cần đăng nhập hoặc đăng ký tài khoản Power BI Pro để truy cập Power BI Desktop
- Chỉ cần đăng nhập để truy cập các công cụ chia sẻ và cộng tác có sẵn thông qua dịch vụ Power BI (app.powerbi.com)
- Lưu ý: Microsoft yêu cầu địa chỉ e-mail của trường/công ty
Giao diện của Power BI Desktop:
Cách tạo một Report với Power BI Desktop
Luồng để tạo ra một Report trên Power BI Desktop như sau:
Trích xuất dữ liệu
Có nhiều kiểu dữ liệu khác nhau mà bạn có thể kết nối từ Power BI Desktop như dữ liệu dạng file, dữ liệu từ các cơ sở lưu trữ và kho dữ liệu, dữ liệu từ hệ thống Power Platform, dữ liệu từ các cơ sở dữ liệu trên Azure, dữ liệu từ các dịch vụ trên mạng Online Service, …
Chỉnh sửa, làm sạch và định dạng
Có thể làm sạch và chuyển đổi dữ liệu bằng Power Query Editor tích hợp sẵn. Bạn có thể thay đổi kiểu dữ liệu, xóa cột, lọc dữ liệu và tạo thêm cột dữ liệu tùy theo nhu cầu mong muốn bằng ngôn ngữ M (Power Query Formula)
- Các Tab phục vụ cho Transform data: Home, Transform, Add Column:
- Table transformations cơ bản:
Tạo mô hình dữ liệu (Create Data Model)
Tạo mối liên hệ giữa các bảng dữ liệu hoặc cũng có thể tạo thành các bảng riêng từ các bảng có sẵn hoặc từ các nguồn khác nhau. Mục đích để dễ dàng thực hiện các biểu thức (DAX) để phân tích dữ liệu (DAX là biểu thức phân tích vô cùng mạnh mẽ với tốc độ xử lý nhanh, hiệu quả)
- Data model là khi các bảng được kết nối với nhau thông qua các Relationships:
- 2 cách để tạo Relationships:
- Quản lý và chỉnh sửa Relationships:
Tạo biểu đồ (Create Visuals)
Khi bạn có mô hình dữ liệu (data model), bạn có thể kéo các trường vào khung báo cáo để tạo biểu đồ. Power BI có sẵn các dạng biểu đồ khác nhau và khá đa dạng như: Bullet Graph, Cycle Plot, Distribution Deviation Graph, Dot Plots, Histogram, …Để tạo hoặc thay đổi dạng biểu đồ, chỉ cần chọn biểu tượng biểu đồ từ khung Visualization
- Insert thuộc tính và các chart cơ bản:
- Formatting Options:
Tạo báo cáo
Một bộ sưu tập các biểu đồ (thực hiện ở mục Tạo biểu đồ) hiển thị trong một tệp Power BI Desktop, được gọi là báo cáo. Một báo cáo có thể có một hoặc nhiều trang, giống như một tệp Excel có thể có một hoặc nhiều bảng tính
Power BI giúp hiển thị các khía cạnh khác nhau từ dữ liệu, giàu hình ảnh, rõ ràng truyền đạt thông tin đến người sử dụng
Chia sẻ báo cáo
Khi báo cáo đã sẵn sàng để chia sẻ với người khác, bạn có thể xuất bản báo cáo lên dịch vụ Power BI và cung cấp cho bất kỳ ai trong tổ chức của bạn có giấy phép Power BI. Để xuất bản báo cáo Power BI Desktop, bạn chọn nút Publish từ nút Home trong Power BI Desktop
Ưu điểm và hạn chế
Ưu điểm
- Được xây dựng từ nền tảng AI (trí tuệ nhân tạo) và Machine Learning (máy học) nên nhạy bén trong việc xử lý dữ liệu
- Cung cấp các báo cáo và dashboard có sẵn
- Bảo mật cao trong việc kết nối các nguồn dữ liệu (qua đám mây hay hệ thống doanh nghiệp)
- Truy vấn ngôn ngữ tự nhiên khi khai thác dữ liệu
- Tích hợp code Python và R để nâng cao chất lượng trực quan hóa
- Power Query giúp người dùng dễ dàng hơn trong việc sử dụng và làm gọn dữ liệu
- Người dùng có thể tạo lịch trình để cập nhật dữ liệu tự động thay vì tốn thời gian thao tác thủ công
Hạn chế
- Tuy được kết nối real-time nhưng nguồn dữ liệu với các báo cáo và dashboard còn khá ít
- Không chấp nhận những file lớn hơn 250MB
- Chỉ những người dùng có cùng tên miền email mới có thể chia sẻ dashboard và báo cáo với nhau
Lời kết
Thông qua bài viết này chúng mình đã giới thiệu về các bước cơ bản để tạo ra một báo cáo trong Power BI Desktop. Từ đó giúp các bạn mới tiếp cận với trực quan hóa dữ liệu có một góc nhìn tổng quan về những ứng dụng của phần mềm này. Chúc các bạn thành công!
Nguyễn Quỳnh Sương – Nguyễn Huỳnh Xuân Mai