Kurser

Online kursus 
Online læring, der kan tages, når det passer dig

Data Science

Tilmelding Garantifor afholdelse

Få adgang til online kurset.
Tilgængeligt i 365 dage.
DKK  11.499
ekskl. moms
Nr. 90210 P

Data Science hjælper dig til at finde ny viden ved hjælp af store datamængder. Med denne kursuspakken kommer du hele vejen rundt om de værktøjer og den viden, der skal til for at kunne arbejde effektivt med data sådan, at du bliver i stand til finde frem til de indsigter, der ligger begravet i datamængderne. Kurserne er på engelsk og foregår online, når det passer dig. Du har adgang til online kurserne i 365 dage.

Online kursus

Introduktion

Med kursuspakken bliver du indført i, hvad det vil sige at arbejde som Data Scientist og lærer hvad, der adskiller feltet fra andre discipliner. Du vil blive introduceret til forskellige praktiske værktøjer, der understøtter dit arbejde med dataindsamling og hvilke kvaliteter værktøjerne indeholder. Du lærer datafiltrering ud fra blandt andet gyldighed og indhold, samt hvordan du transformerer data til et brugbart format med data transformation. Yderligere afdækker lektionerne, hvordan du kan analysere din indsamlede data og strukturere den på en måde, så den er brugbar i dit fremadrettede arbejde.

Du vil blive introduceret til de grundlæggende koncepter inden for dataanalyse, så du kan anvende en bred vifte af software og værktøjer i dit arbejde. Du bliver derudover klar over, hvordan maskinlæring kan hjælpe dig med at skabe modeller fra din data. Endeligt bliver du øvet i at viderekommunikere dine resultater.

Kursuspakken introducerer dig for flere former for relevante værktøjer som f.eks. R, MongoDB, Hadoop, Pandas m.m.

Deltagerprofil

Kurset henvender sig til dig, som ønsker at inddrage Data Science i dit arbejde eller ønsker at forbedre dine kompetencer inden for Data Science. Kurset indeholder en stor mængde lektioner, og kan bruges som et opslagsværk.

Det får du på onlinekurset

Vi sørger for, at rammerne er i orden, så du kan fokusere på at lære.

Undervisning på engelsk

Undervisning på engelsk

Indhold

Data Science Essentials
  • Data science adskiller sig fra akademisk statistik og applikationsprogrammering ved at samle de data, videnskab har brug for, fra en række forskellige discipliner. Kurset forbereder dig til at navigere i de grundlæggende elementer i datavidenskab.
Data Science Using R
  • For at udføre datavidenskab skal du indsamle, filtrere, transformere og udforske datasæt. På dette kursus vil du udforske eksempler på datastrid i R. Der er en række ofte brugte programmeringsteknikker, du kan anvende for at få mest muligt ud af R-sproget. Dette kursus dækker en række forskellige teknikker i R for at øge kvaliteten og ydeevnen af dine R-programmer.
Building Data Pipelines
  • Udforsk datapipelines og metoder til at behandle dem med og uden ETL. På dette kursus lærer du at oprette datapipelines ved at bruge Apache Airflow workflow management-programmet. Kurset dækker datapipelines som en applikation, hvordan man bygger en traditionel ETL-pipeline med batchbehandling, og hvordan man bygger en ETL-pipeline med strømbehandling. Lær derefter, hvordan du opsætter og installerer Apache Airflow; nøglebegreberne i Apache Airflow; hvordan man instansierer en rettet acyklisk graf i Airflow. Lær endelig, hvordan du tester Airflow-opgaver ved at bruge kommandolinjeværktøjet Airflow, og hvordan du bruger Apache Airflow til at oprette en datapipeline.
Balancing the Four Vs of Data
  • De fire V'er (volume, variety, velocity, og veracity) af big data og datavidenskab er et populært paradigme, der bruges til at udtrække mening og værdi fra massive datasæt. På dette kursus lærer du, hvordan du udvinder værdi ved at bruge de fire V'er. Kurset gennemgår variation og datastruktur, og hvordan de relaterer til de fire V'er, og hvordan de relaterer til de fire V'er, og hvordan de fire V'er skal balanceres for at implementere en succesfuld big data-strategi.
Creating Data APIs for Customers
  • Data science færdigheder er kun noget værd, når du har data at arbejde med. Automatisering af din datahentning gennem applikationsprogramgrænseflader (API'er) er en proces, som enhver dataforsker skal forstå. Du lærer hvordan man opretter RESTful OAuth API'er ved hjælp af Node.js, og om oprettelse af en HTTP-server ved hjælp af Hapi.js, og ser derefter på, hvordan du bruger moduler i din API ved hjælp af Node.js, og hvordan du returnerer data med JSON ved hjælp af Node.js.
Cleaning Data in R
  • R er et programmeringssprog, der er essentielt for datavidenskab, brugt til statistisk databehandling og grafik. Du lærer om væsentlige metoder til at wrangle og rense data med R.
Creating Real Time Dashboards
  • Bliv godt til at visualisere data. Lær, hvordan man opretter og bruger dashboards i realtid med Tableau. Begynd med en introduktion til dashboards i realtid og forskelle mellem realtidsdata og streamingdata. Tag derefter et kig på forskellige cloud-datakilder. Lær, hvordan du bygger et dashboard i Tableau og opdaterer det i realtid. Opdag, hvordan du organiserer dit dashboard ved at tilføje objekter og justere layoutet. Tilpas og formatér derefter forskellige aspekter af dashboards i Tableau og tilføj interaktivitet ved hjælp af handlinger som filtrering
Data Analysis Application
  • Lær, hvordan man udfører dataanalyse ved at bruge Anaconda Python R og relaterede analytiske biblioteker og værktøjer.
Data Architecture: Getting Started
  • Dette kursus gennemgår hvordan man definerer data, dataens livscyklus, vigtigheden af privacy og SQL- og NoSQL-databaseløsninger og nøgledatahåndteringskoncepter, når de relaterer til big data.
Data Engineering Fundamentals
  • Datateknik er området for datavidenskab, der fokuserer på praktiske anvendelser af dataindsamling og analyse. Kurset giver dig mulighed for at udforske distribuerede systemer, batch versus in-memory-behandling, NoSQL-brug og de forskellige tilgængelige værktøjer til datastyring/big data og ETL (ekstrahere, transformere og indlæse) processen.
Data Lakes in Practice
  • En nøglekomponent til at wrangle data er rammerne for din data lake. I dette 9-videos Skillsoft Aspire-kursus kan du opdage, hvordan du designer og implementerer datasøer i skyen og på stedet ved at bruge standardreferencearkitekturer og -mønstre til at hjælpe med at identificere den korrekte dataarkitektur.
DevOps for Data Scientists
  • For at implementere DevOps for data science, skal du udvide ideerne fra DevOps til at være kompatible med processerne for data science og machine learning (ML). Kurset giver indblik i koncepterne bag integration af data og DevOps. Kurset underviser dig også i processerne for at anvende DevOps til datavidenskab, herunder integration, pakninger, implementering, overvågning og logning. Kurset udforsker desuden implementering af datamodeller i produktion gennem serialisering, pakning, implementering og tilbagerulning. På kurset lærer du også, hvordan du serialiserer modeller ved hjælp af Python og Pandas.
Data Pipeline to Tableau
  • Kurset udforsker konceptet med datapipelines, de processer og stadier, der er involveret i at bygge dem, og teknologier såsom Tableau og Amazon Web Services (AWS). Kurset viser også, hvordan du implementerer datapipelines ved hjælp af Python Luigi, integrerer Spark og Tableau for at administrere datapipelines, bruger Dask-arrays og bygger datapipelinevisualisering med Python.
Data Rollbacks
  • Lær om datakoncepterne for transaktioner, transaktionsstyringspolitikker og tilbagerulninger. Kurset viser, hvordan du implementerer transaktionsstyring og rollbacks ved hjælp af SQL Server. Kurset udforsker desuden forskellene mellem transaktionsstyring ved at bruge NoSQL og MongoDB og hvordan man implementerer ændringsdatafangst i databaser og NoSQL.
Data Research in Practice
  • For at mestre datavidenskab skal du lære teknikkerne omkring dataforskning. Lær om EDA (exploratory data analysis) og hvilke dataforskningsteknikker, der er nødvendige for at kommunikere med datahåndteringsprofessionelle involveret i anvendelse, implementering og facilitering af dataforskningsmekanismen. Du vil undersøge EDA som en vigtig måde at analysere ekstraherede data på ved at anvende forskellige visuelle og kvantitative metoder. På kurset tilegner elever sig dataudforskningsteknikker til at udlede forskellige datadimensioner for at udlede værdi fra dataene. Kurset udforsker også implementering af statistiske dataforskningsalgoritmer ved hjælp af R til at generere tilfældige tal fra standarddistribution, og visualiseringer ved hjælp af R til grafisk at repræsentere resultatet af dataforskning. Du lærer at anvende statistiske algoritmer som PDF (probability density function), CDF ((cumulative distribution function), binomialfordeling og intervalestimering til dataforskning.
Data Silos, Lakes, and Streams
  • Lær om overgangen fra data warehousing til cloud-baserede løsninger ved hjælp af AWS (Amazon Web Services) cloud-platformen. Kurset gennemgår forskellige implikationer involveret i lagring af forskellige typer data fra forskellige kilder i en organisation. Desuden udforsker kurset, hvordan data lakes opbevarer data gennem en flad struktur, og hvordan dataene er tagget, så det er nemt at søge i. Kurset giver dig desuden mulighed for at udforske Amazon Redshift, en fuldt administreret petabyte-skala datavarehustjeneste, som er en del af den større AWS cloud-computing-platform. Kurset på 12 videoer viser, hvordan man opretter og konfigurerer en Amazon Redshift-klynge, hvordan man indlæser data i den, fra en S3-bøtte og konfigurere en Glue-crawler til lagrede data.
Deploying Data Tools for All Users
  • Udforsk en række af de nyeste datavidenskabelige værktøjer i dag, de forskellige anvendelser af værktøjerne og fordelene og udfordringerne ved at implementere dem. På kurset arbejder vi først med at undersøge en datavidenskabsplatform. Derefter skal vi udforske analyseprocessen for at inspicere, rense, transformere og modellere data, for dernæst at undersøge integration og udforskning af data, kodning og opbygning af modeller ved hjælp af disse data, implementering af modellerne til produktion og levering af resultater gennem applikationer eller ved at generere rapporter. Du vil se, hvordan en fantastisk datavidenskabsplatform bør være fleksibel og skalerbar, og den bør kombinere flere funktioner og muligheder, der effektivt centraliserer datavidenskabelige indsatser.
Data Wrangling with Python/Pandas
  • Pandas, et populært Python-bibliotek, er en del af open source PyData-stakken. Pandas repræsenterer data i et tabelformat, som gør det nemt og intuitivt at udføre datamanipulation, -rensning og -udforskning. Kurset bruger Python, det foretrukne programmeringssprog for datavidenskab, til at udforske data i Pandas med populære diagramtyper såsom søjlediagram, histogram, cirkeldiagram og boksplot. Opdag, hvordan du arbejder med tidsserier og strengdata i datasæt. Pandas repræsenterer data i et tabelformat, som gør det nemt at udføre datamanipulation, rensning og dataudforskning, alle vigtige dele af enhver dataingeniørs værktøjskasse. Du lærer desuden at bruge Pandas DataFrame til at udføre avancerede kategorigruppering, aggregeringer og filtreringsoperationer.
Enterprise Governance Strategier
  • Dette kursus udforsker nøglebegreberne bag governance og dets forhold til big data. Big data er store og komplekse, ofte repræsenteret af enorme mængder af meget granulære data, der skal beskyttes mod misbrug. Kurset undersøger de fem hovedkrav, til når en altomfattende styringsstrategi planlægges og udformes.
Enterprise Value Through Data
  • Kurset undersøger datadrevne organisationer, hvordan de bruger datavidenskab og vigtigheden af at prioritere data. Datadrevne organisationer er forpligtet til at indsamle og udnytte data, der er nødvendige for en virksomhed holistisk for at opnå konkurrencefordele. Du vil undersøge, hvordan man skaber en kultur i en organisation ved at involvere ledelsen og træne medarbejdere.
 

 

Tidsforbrug

Kurset indeholder en stor mængde lektioner, og kan bruges som et opslagsværk. Hele kursuskollektionen består af 153 moduler og giver adgang til over 145 timers læring.

Form

Denne online kursuspakke består af flere forskellige kurser, som du ved tilmelding har adgang til i 365 dage. Hvert enkelt kursus er opdelt i flere kursusmoduler, som du via en oversigtsmenu kan tage i den rækkefølge, du ønsker. Modulerne indeholder lyd, billeder og tekst, der gennemgår kursusindholdet. Nogle moduler indeholder små videofilm med scenarier og cases. Ved hvert kursus har du mulighed for at teste din forståelse af indholdet med tests, som du kan tage både før, under og efter kurset. Du gennemfører kursusmodulerne via din computer eller tablet med lyd og adgang til Internettet. Du kan selv styre, hvornår du vil tage modulerne – og de kan sættes på pause undervejs. Der bliver indsat bogmærker, der hvor du er nået til, så du altid har mulighed for at fortsætte, hvor du sidst kom til.

Læs mere om vores online kurser og se svar på dine spørgsmål (FAQ).

Søgte du et andet online kursus?

Vi tilbyder en bred vifte af forskellige kurser inden for mange områder. Kontakt os på tlf. 72203000 eller kurser@teknologisk.dk, så vi kan hjælpe med at imødekomme dit behov.

Se desuden listen over vores udvalgte online kurser.

Køb online kursus til flere

Er I en afdeling, en hel virksomhed eller blot flere personer, der ønsker adgang til online kurser, så kontakt os og få et tilbud på tlf. 72203000 eller kurser@teknologisk.dk.

Vil du vide mere?

5 ting du bør vide om Machine Learning

På baggrund af algoritmer kan computeren nu lære at identificere mønstrer i data, for derefter at lave forudsigelser ud fra disse data. Bliv klogere på Machine Learn...

Læs mere
 

Hvad kan Machine Learning? Og hvordan kan du anvende det?

Machine Learning er et felt inden for datalogi, hvor der arbejdes med at gøre computere i stand til at ”lære” og progressivt forbedre deres læring og res...

Læs mere