word studentlid

— donderdag 11 april 2013, 14:06 | 0 reacties, praat mee

Les 4: Importeren

Importeren

Hoe krijg je je data op een fatsoenlijke manier in Excel? Vaak worden data in een Excelformat aangeboden, maar niet altijd. Soms kun je knippen en plakken, maar het is handiger om data gestructureerd binnen te halen.

We gaan een tekstfile importeren.


Neem de cijfers over incidenten met werknemers in Justitiële inrichtingen in Nederland: Download tekstbestand. We willen deze data gebruiken voor een nieuwsverhaal over het aantal ontslagen medewerkers per inrichting. Deze data zitten echter in een tekstfile, waarbij de kolommen zijn gescheiden door middel van tabs. Hier kun je weinig mee.


In Excel kun je makkelijk tekstfiles importeren. Je gaat naar ‘gegevens’ en ja dat is verwarrend omdat je geneigd bent om onder ‘invoegen’ te kijken. Je selecteert van tekst. Kies de file uit die je wilt hebben en dan krijg je een wizard die je helpt bij het importeren. In het vak beneden zie je een voorbeeld van hoe de tabel eruit komt te zien. Je kunt kiezen tussen vaste breedte en gescheiden. Meestal kies je voor gescheiden. Als alles goed staat, druk je op volgende.


Dan moet je aangeven hoe de kolommen zijn gescheiden. Hij kiest automatisch tab en in dit geval is dat correct. Maar vaak worden kolommen ook gescheiden door een puntkomma, of een komma. Je kunt ook nog zelf een invoeren onder overige.


Je drukt wederom op Volgende. Dan kun je de kolommen gaan formatteren, aangeven wat het is. Vaak hoef je niets te doen, maar laten we eens kijken. Nu staat de eerste kolom, in het zwart, op standaard. Deze kolom is een opsomming van alle justitiële inrichtingen. Alleen de vierde kolom bevat cijfers en die zouden we als zodanig kunnen benoemen. In dit geval hoeft het niet en drukken we op voltooien. Tot slot krijg je de vraag waar je de gegevens wilt importeren. Je kunt handmatig een locatie invoeren waarbij je doorgaans de linkerbovenhoek, dus A1 kiest (over de dollartekens komen we later nog te spreken). Je kunt ook klikken op de cel waar je de tabel hebben wilt en je drukt OK.


Zijn we dan klaar?


Nee. De tabelstructuur is niet in orde. Helemaal bovenaan zie je waar de data betrekking op hebben, namelijk OVERZICHT 2007. Als we naar beneden scrollen, komen we tussendoor ook nog andere jaren tegen. Excel kan hier niet goed mee overweg. We willen de data in kolommen hebben en de kolomnamen netjes bovenaan hebben. Maar als we OVERZICHT 2007 weghalen weten we niet welke records betrekking hebben op welk jaar. Dit lossen we op door een kolom toe te voegen met de jaartallen.


Je klikt met je muis op de bovenste balk van de eerste kolom (of waar je de jaartallen hebben wilt), en selecteert ‘invoegen’. Dan geef je de kolom een kop en gaat hem vullen met de juiste jaartallen. Als we dat gedaan hebben, verwijderen we de rijen die we niet nodig hebben. We geven de sheet nog even een naam en slaan het werkboek op.


Laten we ook nog twee andere bestandsformaten importeren.


XML lokale vergunningen. Dit bestand geeft toegang tot alle lokale vergunningen. Daar kun je uiteraard interessante informatie in vinden. De data worden ontsloten door middel van een URL die je kunt aanpassen. In dit geval zoek je zonder keyword en krijg je 10 resultaten terug in een XML-format.


XML (Extensible Markup Language) is een zeer gangbaar format. Het is zeer gestructureerd en gemaakt voor het uitwisselen van data. Op het eerste gezicht kun je er echter niet zoveel mee, maar dat is schijn. Ook Excel weet namelijk raad met XML.


Je gaat naar ‘gegevens’, ‘externe gegevens ophalen’, ‘van XML-gegevensimport’. Dat is alles.


Tot slot behandelen we nog CSV-bestanden. CSV staat voor Comma Seperated Value. Dat betekent dat de kolommen door een komma of door een ander teken worden gescheiden. CSV’s zijn hele kale files, met minimale opmaak en worden veel gebruikt. In de kern zijn het tekstfiles. De meeste spreadsheet- en visualisatieprogramma’s kunnen prima met CSV overweg.


Laten we eens kijken naar deze set, een overzicht van de balansen van alle bevoegd gezagen in het voortgezet onderwijs van de afgelopen vijf jaar. [CSV]. Je gaat naar ‘gegevens’, ‘externe gegevens ophalen’, ‘tekstfile’. En dat is wederom alles.

Bijlage

 

Laatste wijziging: 9 juli 2013, 18:46

Bekijk meer van

Tip de redactie

Logo Publeaks Wil je Villamedia tippen, maar is dat te gevoelig voor een gewone mail? Villamedia is aangesloten bij Publeaks, het platform waarmee je veilig en volledig anoniem materiaal met de redactie kunt delen: publeaks.nl/villamedia

Praat mee

Colofon

Villamedia is een uitgave van Villamedia Uitgeverij BV

Uitgever

Dolf Rogmans

Postadres

Villamedia Uitgeverij BV
Postbus 75997
1070 AZ Amsterdam

Bezoekadres

Johannes Vermeerstraat 22
1071 DR Amsterdam

Factuurgegevens

Villamedia Uitgeverij BV
Johannes Vermeerstraat 22
1071 DR Amsterdam

Contact

redactie@villamedia.nl

Redactie (tips?)

Chris Helt, hoofdredacteur

Marjolein Slats, adjunct-hoofdredacteur

Linda Nab, redacteur

Lars Pasveer, redacteur

Trudy Brandenburg-Van de Ven, redacteur

Rutger de Quay, redacteur

Sales

Sofia van Wijk

Emiel Smit

Teddy van der Laan

Webbeheer

Marc Willemsen

Vacatures & advertenties

vacatures@villamedia.nl

Bereik

Villamedia trekt maandelijks gemiddeld 120.000 unieke bezoekers. De bezoekers genereren momenteel zo’n 800.000 pageviews.

Rechten

Villamedia heeft zich ingespannen om alle rechthebbenden van beelden en teksten te achterhalen. Meen je rechten te kunnen doen gelden, dan kun je je bij ons melden.