一個(gè)計(jì)算機(jī)專(zhuān)業(yè)學(xué)生,在Netflix式換臺(tái)(AI?Web?網(wǎng)絡(luò)安全?)之后,終于盯上了數(shù)據(jù)分析。她的第一個(gè)Power BI項(xiàng)目,用一家虛構(gòu)巧克力公司的銷(xiāo)售數(shù)據(jù)練手——結(jié)果發(fā)現(xiàn)的坑,比數(shù)據(jù)本身更值錢(qián)。
01|工具上手:比Excel多一層,少一半
Meghana的啟動(dòng)姿勢(shì)很標(biāo)準(zhǔn):下載Power BI Desktop,導(dǎo)入CSV,拖拽字段。前10分鐘流暢得像在填Excel表格——直到她想做一個(gè)「按月份看銷(xiāo)量」的圖表。
Excel里選中兩列插入折線(xiàn)圖就行。Power BI不行。它要求你先理解「數(shù)據(jù)模型」:日期表、關(guān)系、度量值。Meghana在筆記里寫(xiě):「這不是多了一個(gè)步驟,是多了一個(gè)世界觀(guān)。」
Power BI把「分析」和「可視化」拆成了兩層。表層是拖拽的友好,底層是DAX公式和星型模型。新手常卡在表層覺(jué)得簡(jiǎn)單,進(jìn)到底層突然懵掉——就像游戲新手村門(mén)口站著個(gè)滿(mǎn)級(jí)BOSS。
她花了2小時(shí)搞懂CALCULATE函數(shù),終于讓「月度銷(xiāo)售額」動(dòng)起來(lái)。這個(gè)函數(shù)后來(lái)成了她的高頻工具:它能在篩選器里再套篩選器,像給數(shù)據(jù)戴了副變色眼鏡。
02|數(shù)據(jù)清洗:80%時(shí)間耗在導(dǎo)入前
Awesome Chocolates的數(shù)據(jù)集看起來(lái)干凈——直到Meghana發(fā)現(xiàn)「Ship Date」列混著兩種日期格式,「Region」字段里「APAC」和「Asia Pacific」被當(dāng)成兩個(gè)地區(qū)。
Power Query編輯器成了她的主戰(zhàn)場(chǎng)。這里的設(shè)計(jì)很產(chǎn)品經(jīng)理思維:把ETL(抽取-轉(zhuǎn)換-加載)流程可視化,每一步變成可回溯的節(jié)點(diǎn)。她刪掉空行、拆分地址列、用條件列合并重復(fù)標(biāo)簽——全程沒(méi)寫(xiě)一行代碼。
但有個(gè)反直覺(jué)點(diǎn):Power Query的「應(yīng)用步驟」是順序執(zhí)行的,改中間一步,后面全重算。Meghana在第15步發(fā)現(xiàn)第3步的替換規(guī)則漏了特例,回改后等了40秒刷新。她開(kāi)始理解為什么老玩家建議「盡早定型數(shù)據(jù)結(jié)構(gòu),別在Query里做太復(fù)雜的邏輯」。
清洗完的數(shù)據(jù)量從原始1.2萬(wàn)行變成有效9,800行。她在復(fù)盤(pán)里寫(xiě):「扔掉的數(shù)據(jù)比留下的更有故事——那些缺失的郵編、矛盾的訂單日期,都是業(yè)務(wù)流程的X光片。」
03|可視化陷阱:好看和好用是零和博弈
Meghana的第一版dashboard很「豐富」:餅圖、環(huán)形圖、瀑布圖、KPI卡片擠在一屏。她發(fā)給朋友看,對(duì)方反問(wèn):「所以哪個(gè)產(chǎn)品最賺錢(qián)?」
她重讀了Power BI的設(shè)計(jì)文檔,發(fā)現(xiàn)一個(gè)被新手忽略的功能:書(shū)簽(Bookmarks)。這不是給頁(yè)面做標(biāo)記,而是能保存篩選狀態(tài)、聯(lián)動(dòng)多個(gè)視覺(jué)對(duì)象的「場(chǎng)景快照」。她做了三個(gè)書(shū)簽:「全球概覽」「北美深挖」「物流異常」——點(diǎn)擊切換,整個(gè)頁(yè)面的篩選器和圖表跟著變。
這個(gè)設(shè)計(jì)讓dashboard從「信息展板」變成了「對(duì)話(huà)界面」。用戶(hù)不需要理解你的數(shù)據(jù)模型,只需要跟著你的問(wèn)題鏈走。
她還試了「鉆取」(Drillthrough):在總覽頁(yè)右鍵點(diǎn)擊某個(gè)地區(qū),直接跳轉(zhuǎn)到該地區(qū)的詳細(xì)頁(yè),自動(dòng)帶上篩選條件。這個(gè)功能藏得很深——要在目標(biāo)頁(yè)開(kāi)啟「鉆取」開(kāi)關(guān),再在源頁(yè)設(shè)置字段關(guān)聯(lián)。Meghana吐槽:「微軟把最實(shí)用的功能埋在了右鍵菜單里,就像把家門(mén)鑰匙藏在門(mén)墊下面。」
04|發(fā)布之后:本地文件和云端服務(wù)的裂縫
項(xiàng)目收尾時(shí),Meghana想把報(bào)告分享給導(dǎo)師。Power BI Desktop文件(.pbix)直接發(fā)過(guò)去?對(duì)方得裝軟件、配數(shù)據(jù)源。她轉(zhuǎn)向Power BI Service——微軟的云服務(wù),免費(fèi)版就能發(fā)布。
這里踩了最后一個(gè)坑:本地?cái)?shù)據(jù)源需要「網(wǎng)關(guān)」(Gateway)才能自動(dòng)刷新。她的CSV文件存在筆記本里,Service端無(wú)法直接訪(fǎng)問(wèn)。解決方案要么把文件傳OneDrive用云端路徑,要么裝個(gè)個(gè)人網(wǎng)關(guān)讓電腦當(dāng)服務(wù)器。
這個(gè)架構(gòu)設(shè)計(jì)暴露了Power BI的產(chǎn)品定位:它不只是單機(jī)工具,是微軟生態(tài)的入口。個(gè)人用戶(hù)用免費(fèi)版夠用,企業(yè)用戶(hù)遲早要碰Azure、Office 365、SharePoint的聯(lián)動(dòng)。Meghana在筆記里畫(huà)了個(gè)箭頭:「免費(fèi)是最貴的試用裝。」
最終她的dashboard上線(xiàn)了:一個(gè)巧克力公司的銷(xiāo)售看板,帶日期篩選、地區(qū)鉆取、物流延遲預(yù)警。數(shù)據(jù)是假的,但踩的坑是真的。
她在項(xiàng)目總結(jié)里留了個(gè)問(wèn)題:「當(dāng)工具把『專(zhuān)業(yè)級(jí)分析』的門(mén)檻降到拖拽就能做,分析師的價(jià)值會(huì)往上移還是往下沉?」
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.