Men hur bygger man ett datalager? Och hur hänger det ihop med alla andra system ditt företag använder?
Häng med – vi ska undvika att bli alltför tekniska.
Vad är ett datalager?
Till och börja med, vad är det egentligen för skillnad på ett datalager och en ”vanlig” databas? Båda lagrar ju data.
Det som skiljer dem åt är framför allt syftet.
Ett datalager är byggt för att lagra stora mängder historisk data och möjliggöra snabba, komplexa frågor till all data, vanligtvis genom så kallad Online Analytical Processing (OLAP). Man vill bland annat kunna jämföra statistik från olika månader och år, följa upp KPIer, hitta mönster i målgruppens beteende och så vidare.
Databaser är istället mestadels till för att lagra aktuella transaktioner och möjliggöra snabb åtkomst till specifika transaktioner i pågående affärsprocesser, känt som OLTP (Online Transaction Processing). De kan röra sig om en summa pengar som flyttas från ett konto till ett annat eller en kundorder som läggs till i ordersystemet.
Så hur skapar man ett datalager?
Processen kallas ETL: Extract, Transform, Load. Med andra ord hämta, omvandla och ladda ned.
I första steget, hämtningen, gäller det att välja ut, hitta och samla ihop all data man behöver. I praktiken laddar man ned en delmängd data från sina datakällor, oftast olika transaktionssystem som affärssystem, betalningssystem och kundregister.
I andra steget, omvandlingen, bearbetas, valideras och tvättas datan. Att tvätta data innebär att man transformerar den så att den blir enhetlig och analysvänlig. Innan den är redo för datalagret behöver all data till exempel följa de format och definitioner som gäller för datalagret. Att definiera datavariablerna så att de stöder företagets mål och processer är avgörande för vilken nytta företaget kommer att ha av sin dataanalys.
I det tredje steget, ladda ned, skrivs datan in i datalagret i korrekt lagringsformat. Om man har gjort allt rätt har man nu all data på ett ställe, organiserad efter en gemensam datamodell och analysstruktur. Ordning och reda.
Men hur kommer man åt all data i lagret, eller rättare sagt, den data man behöver?
Datalager och Data Mart
Ett Data Mart, eller dataförråd, innehåller en delmängd av information hämtad från datalagret, som behövs för en viss arbetsuppgift eller avdelning inom företaget. En enskild medarbetare brukar ju inte ha tillgång till all information i datalagret utan bara den information han eller hon behöver – och i det format som passar deras uppgifter. En säljchef behöver till exempel snabbt kunna se status för sina kunder och prospekt. En produktionschef behöver snabbt bli uppmärksammad på avvikelser i produktionsprocessen. Olika analysverktyg, till exempel Micosofts Power BI , ger möjlighet att anpassa unika instrumentpaneler (dashboards) för varje medarbetare, som visar data skräddarsydda efter arbetsroll.
Nu har du allt du behöver för att börja gräva i datan och generera affärskritisk kunskap. Allt som krävs nu för att omvandla data till affärsnytta är fantasi, analysförmåga – och en hel del annat. Läs om vad en dataanalytiker gör på jobbet hela dagarna och varför data scientists är så hett eftertraktade.