如何在Power BI上獲取多個來源的資料

如何在Power BI上獲取多個來源的資料

您的系統上安裝了 Power BI,您是否想知道:“我可以從多個來源獲取資料嗎?” 比如,六個不同的來源,或者一些 Excel 檔案,使用 SQL 資料庫,甚至從網路上獲取一些即時匯率?

簡而言之,答案是肯定的,完全可以。這確實是 Power BI 的一大優勢——它專為連線、混合和視覺化來自多個來源的資料而構建。

在本文中,我將透過實際示例,向您講解如何在 Power BI 中連線到多個資料來源。我還會分享一些關於如何正確組合資料的重要技巧,以免您的報告日後出現問題。

瞭解Power BI中的資料來源

在深入探討之前,我們先來明確一下“資料來源”究竟是什麼。

在 Power BI 中,資料來源幾乎可以是任何包含資料的內容。它可以是:

  • Excel 或 CSV 等檔案
  • 資料庫(SQL Server、PostgreSQL 等)
  • 雲平臺(例如 Azure 或 SharePoint)
  • 即時資料 Feed 或 Web API
  • 甚至是另一個 Power BI 資料集

沒錯,您可以在一份報表中同時連線多個資料來源。但您需要妥善管理它們(尤其是在關係和重新整理方面)。

資料來源型別

為了幫助您瞭解情況,以下是資料來源的大致分類:

類別 示例
檔案 Excel、CSV、XML、JSON、PDF
資料庫 SQL Server、MySQL、PostgreSQL
雲服務 SharePoint、OneDrive、Azure
網站與 API 帶表格的網站、REST API

這裡列出了 Power BI 中的所有功能。

Power BI 中的所有功能

Power BI 在連線各種資料來源方面表現出色。無論您的資料是簡單的 Excel 檔案、可靠的 SQL Server 資料庫、雲服務,還是即時的 Web API,Power BI 都能無縫銜接。這種令人難以置信的靈活性意味著您可以輕鬆地從任何地方整合資訊,從而構建全面的儀表板並獲取洞察,從而全面展現您的業務。

如何在Power BI中連線多個資料來源

現在,讓我們進入本文的核心部分:如何在 Power BI 中連線所有這些不同的資料來源?讓我一步步指導您。

  1. 開啟 Power BI Desktop
  2. 在“主頁”功能區中點選“Get Data”。

Power BI獲取資料

  1. 選擇您的第一個源,例如“Excel Workbook”,然後單擊“Connect”。

Power BI連線Excel工作簿

  1. 導航到 Excel 檔案並開啟它。

Excel 檔案

  1. 現在,在導航器中,選擇需要匯入 Power BI 的檔案並載入所需的資料。您可以透過點選“Transform Data”在 Power Query 中對其進行轉換。

Transform Data

  1. 現在您的資料將載入到 Power BI。

載入到 Power BI

  1. 接下來,再次點選“Get Data”。這次,可以選擇 Web

Power BI獲取網路資料

  1. 貼上包含一些公共資料的 URL(例如,歐洲足球錦標賽維基百科頁面上的結果表:https://en.wikipedia.org/wiki/UEFA_European_Football_Championship

公共資料的 URL

  1. 在導航器中載入資料後,選擇所需的工作表或表格並載入到 Power BI。如果需要,您還可以轉換資料。

載入到 Power BI

  1. 根據需要不斷重複。您連線的每個源都將成為模型中的一個新表。

成為模型中的一個新表

Power BI中的連線模式型別

在 Power BI 中連線資料時,您可以選擇兩種主要的連線模式:Import(我們之前使用過)和 DirectQuery。每種模式都有各自的優缺點,瞭解它們對於構建高效、響應迅速的儀表板至關重要。

1. 匯入模式

這是大多數情況下最常用和推薦的連線模式。在此方法中,Power BI 從資料來源提取資料並將其本地儲存在 .pbix 檔案中。當資料不頻繁更改或需要高效能和完整的建模功能時,這種方法效果最佳。

優點:

  • 高效能:由於資料載入到 Power BI 的記憶體引擎中,因此報表速度快且響應迅速。
  • 豐富的功能:您可以充分利用 DAX、複雜的資料轉換、計算列和自定義度量。
  • 離線訪問:匯入後,即使沒有即時連線到資料來源,也可以分析資料。

缺點:

  • 資料新鮮度:由於資料在重新整理前是靜態的,因此除非您定期重新整理,否則您的報告可能會過時。
  • 檔案大小限制:如果不進行最佳化,非常大的資料集可能會增加 .pbix 檔案的大小,並導致效能問題。

2. DirectQuery模式

在 DirectQuery 模式下,Power BI 不會儲存資料。相反,它會在您每次與報表互動時向源傳送查詢。資料保留在源系統中,Power BI 僅在需要時提取所需的資料。在即時或近即時資料至關重要的場景中,它是更好的選擇。請確保在使用 DirectQuery 時,底層資料來源能夠高效地處理頻繁的查詢負載。

優點:

  • 即時訪問:您始終可以看到最新資料,這對於運營或監控儀表板來說是理想的選擇。
  • 無大小限制:由於資料不儲存在報表檔案中,因此無需擔心記憶體或檔案大小限制。

缺點:

  • 效能較慢:每次點選或互動都會向資料來源傳送查詢,這可能會導致延遲,具體取決於資料來源的速度和工作負載。
  • 功能受限:某些 Power BI 功能(例如某些 DAX 函式、資料轉換和計算表)受到限制或不可用。
  • 依賴於資料來源可用性:如果資料來源出現故障,報表將崩潰或載入緩慢。

值得嘗試的熱門真實資料來源

如果您正在嘗試或編寫教程(就像我在這裡做的一樣),最好使用免費且易於訪問的資料來源。以下是我的一些精選:

來源 有用性
Excel / CSV 易於建立模擬資料
網頁 / API 獲取即時資料,如匯率或天氣
OData Feed Microsoft 提供公共 OData 供給(Northwind)
本地 SQL Server 提供資料庫風格的資料結構

有了所有這些免費選項,您可以跳過 Salesforce 或 Azure 等來源,除非您已經為這些平臺付費。

在Power BI中合併來自多個來源的資料

現在您的報告中已經包含了所有這些來源,但如何讓它們協同工作呢?

這時 Power Query模型檢視就派上用場了。

在 Power Query 中,您可以:

  • 轉換每個資料集、重新命名列、篩選行以及更改資料型別
  • 如果表相似(堆疊行),請使用“Append
  • 如果要透過鍵值連線表(例如 VLOOKUP),請使用“Merge

在“模型檢視”中,您可以:

  • 定義表之間的關係(例如,訂單錶連結到產品表)
  • 始終檢查一對多多對多問題
  • 不要建立迴圈引用,Power BI 不喜歡這種情況

效能和重新整理注意事項

混合資料來源時需要小心謹慎,尤其是當一些資料來源來自雲端,而一些來自本地時。以下是一些需要注意的事項:

  • 匯入模式 = 獲取資料的最快方式,並支援所有 Power BI 功能。
  • DirectQuery = 保持更新,但速度較慢,轉換功能有限。
  • 有些資料來源不會自動重新整理,您需要為它們設定閘道器(尤其是本地 SQL)。
  • 如果憑據設定不正確,計劃重新整理可能會失敗。

專業提示:如果可能,請將所有資料保持在相同模式(全部匯入或全部 DirectQuery),以避免相容性問題。

用例示例

假設您要建立一個儀表板,顯示以下內容:

  • 月度預算:來自 CSV 檔案
  • 實際銷售額:來自 SQL Server 表(本地)
  • 匯率:來自公共 API(例如 exchangerate-api.com)

操作方法如下:

  1. 連線到測試/CSV

連線到測試/CSV

  1. 載入預算表。我這裡使用的是示例表,您可以隨意載入自己的資料集。

載入預算表

  1. 連線到 SQL Server。

連線到 SQL Server

  1. 按地區載入銷售額資料(或您選擇的任何其他資料)。在 SQL Server 資料庫對話方塊中,輸入伺服器和資料庫(可選)名稱,並確保資料連線模式設定為匯入。

按地區載入銷售額資料

  1. 選擇“OK”,在下一個螢幕上驗證您的憑據,然後選擇“Connect”。
  2. 選擇所需的表並載入資料。
  3. 使用“Get Data > Web”提取匯率(https://app.exchangerate-api.com)。

提取匯率

  1. 在 Power Query 中,轉換並格式化所有表格。

轉換並格式化所有表格

  1. 將匯率與銷售額合併以轉換數值。
  2. 建立視覺化效果(條形圖、KPI、地圖)。

現在,您擁有一份可以與來自三個不同來源的資料進行通訊的報告。

請記住:

  • 除非您需要即時資料,否則請使用匯入模式
  • 謹慎地組合資料,先進行清理,然後根據需要進行關聯或連線。
  • 不要過度混合所有可能的來源。從小規模開始,並根據需要擴充套件。
  • 如果您是新手,請嘗試使用 Excel + OData + Web API,所有這些都免費且易於使用。

關於SQL Server資料(本地)的重要說明

由於您的 SQL Server 資料是本地來源,因此您需要設定 Power BI 本地資料閘道器。將此閘道器視為允許 Power BI(在雲端執行)安全連線到您本地 SQL Server 資料庫的安全橋樑。

配置閘道器後,您可以為報告安排自動資料重新整理。這意味著您的儀表板將始終保持最新的銷售資料,而無需您手動重新整理 Power BI Desktop 中的資料。您可以直接在 Power BI 服務中設定重新整理頻率(例如,每日、每小時)。

如果沒有閘道器,Power BI 將無法訪問您的本地 SQL Server,每次更新報表時,您都不得不手動匯入銷售資料。

小結

在 Power BI 中連線多個資料來源不僅僅是可能,更是該平臺最強大的功能之一。Power BI 讓從本地 Excel 檔案、雲平臺、SQL 資料庫、即時 API 等各種資料來源提取資料變得非常簡單(且功能強大)。它讓您可以靈活地將所有這些資料融合成一份統一、富有洞察力的報表。然而,成功的關鍵在於管理資料關係、選擇正確的連線模式以及規劃重新整理需求。只需稍加練習,您就能輕鬆構建功能強大的多源儀表板,展現完整的資料。

評論留言