Å skrape nav.no for informasjon om stillinger er ganske tungvindt. Det er to enkle måter å få alt gjennom åpne og publiserte grensesnitt.
- RSS
- Widget
For å gjøre et utvalg, gjør et enkelt søk på kategorien som er av interesse eller trykk søk på forsiden for å få alt.
Se nederst på siden for lenker til en RSS 2.0 feed og lenke til en side med Widget-versjonen. På widget siden får du en skreddersydd HTML-snutt for å legge inn stillingene på en vilkårlig side uten noen form for utvikling.
Du kan endre antall stillinger som vises med å endre tallet i rpp-parameteren fra 50 til f.eks. 2000 eller et annet tall. F.eks. 10 annonser er vist under.
Tips: For engelskspråklige stillinger er konvensjonen å bruke søkeordet english (https://tjenester.nav.no/stillinger/stillinger?q=english)
<div id="nav_stillinger" ></div>
<script type="text/javascript" src="https://tjenester.nav.no/stillinger/widget?sort=akt&rpp=10&p=0&rv=al"> </script>
I RSS ligger hele stillingsannonsen og metadata for stillingen i gdata-tagger for publiseringsdato, arbeidsgiver, industri og stillingsfunksjon. Utover dette er kodeverket på tjenesten standardisert, slik at det bør kunne danne et godt grunnlag for mange analysetyper.
Selve annonsen ligger inne i en CDATA blokk for at den skal være kompatibel med spesifikasjonen til RSS.
Skraping
Status
<script src="/tovare/js/d3.v3.min.js" charset="utf-8"></script>
<div id="e1"> </div>
<script>
d3.json("https://tovare.com/api/stillinger", function(data) {
console.log(data);
mdiv = d3.select("#e1");
mdiv.append("h2").text( "Stillinger i dag " + data.stillinger );
mdiv.append("h2").text( "Annonser i dag " + data.annonser );
mdiv.append("h2").text( "Nye " + data.nye );
});
</script>
Scrape server: https://github.com/tovare/nstillinger