April 27, 2015

Åpne data - Stillinger fra NAV.no

Å skrape nav.no for informasjon om stillinger er ganske tungvindt. Det er to enkle måter å få alt gjennom åpne og publiserte grensesnitt.

  • RSS
  • Widget

For å gjøre et utvalg, gjør et enkelt søk på kategorien som er av interesse eller trykk søk på forsiden for å få alt.

Se nederst på siden for lenker til en RSS 2.0 feed og lenke til en side med Widget-versjonen. På widget siden får du en skreddersydd HTML-snutt for å legge inn stillingene på en vilkårlig side uten noen form for utvikling.

Du kan endre antall stillinger som vises med å endre tallet i rpp-parameteren fra 50 til f.eks. 2000 eller et annet tall. F.eks. 10 annonser er vist under.

Tips: For engelskspråklige stillinger er konvensjonen å bruke søkeordet english (https://tjenester.nav.no/stillinger/stillinger?q=english)

<div id="nav_stillinger" ></div>
<script type="text/javascript" src="https://tjenester.nav.no/stillinger/widget?sort=akt&rpp=10&p=0&rv=al"> </script>

I RSS ligger hele stillingsannonsen og metadata for stillingen i gdata-tagger for publiseringsdato, arbeidsgiver, industri og stillingsfunksjon. Utover dette er kodeverket på tjenesten standardisert, slik at det bør kunne danne et godt grunnlag for mange analysetyper.

Selve annonsen ligger inne i en CDATA blokk for at den skal være kompatibel med spesifikasjonen til RSS.

Skraping

Status

<script src="/tovare/js/d3.v3.min.js" charset="utf-8"></script>

    <div id="e1"> </div>

    <script>
    d3.json("https://tovare.com/api/stillinger", function(data) {
        console.log(data);
        mdiv = d3.select("#e1");
        mdiv.append("h2").text( "Stillinger i dag " + data.stillinger );
        mdiv.append("h2").text( "Annonser i dag " + data.annonser );
      mdiv.append("h2").text( "Nye " + data.nye );
    });
    </script>

Scrape server: https://github.com/tovare/nstillinger

© Tov Are Jacobsen 2016