Systemutvecklare
Sista svarsdag: 17/6
Uppdragsplats: Stockholm
Uppdragsperiod: 2026-07-01 - 2027-06-30 + option 6 månader
Omfattning: 100%
Beställaren söker en erfaren Data Engineer och Systemutvecklare för att färdigställa och vidareutveckla Karolinskas Data Lake-plattform och forskningsinfrastruktur. Uppdraget omfattar utveckling av datapipelines, integrationer och data processing services som stödjer vårdens och forskningens behov av tillgänglig, strukturerad och kvalitetssäkrad data. Arbetet är en central del i att möjliggöra Karolinskas mål om bättre vård genom datadrivna arbetssätt.
Uppdraget är i en aktiv och kritisk utvecklingsfas. Konsulten förväntas ha förmåga att omedelbart ta ägarskap över befintlig arkitektur och pågående implementation utan behov av längre introduktionstid. Plattformen bygger på en komplex teknisk stack med metadatadriven ETL-design, Apache Iceberg open table format, PII-anonymisering av känslig klinisk data samt OpenShiftbaserad infrastruktur. Djup förståelse för dessa tekniker är en förutsättning för att upprätthålla kontinuitet och leveranskvalitet i uppdraget.
Konsulten ska:
Färdigställa och vidareutveckla det metadatadrivna ETL-pipeline-ramverket för forskningsplattformen
Säkerställa korrekt hantering och anonymisering av känslig klinisk data i enlighet med gällande regelverk
Förvalta och vidareutveckla Data Lake-arkitekturen baserad på Apache Iceberg, Spark och Trino
Bygga och förvalta integrationer mot kliniska källsystem och databaser
Säkerställa kodkvalitet och robusta lösningar genom testdriven utveckling, kodgranskning och automatisering
Arbeta nära övriga utvecklare, produktägare och arkitekter för att skapa skalbara och hållbara lösningar på OpenShift
Leverantörer selekterade för deltagande i del 2 kommer kontaktas med förslag till datum för elektronisk genomgång. Preliminär tidpunkt är en vecka efter anbudsöppning. Genomgången sker via MS Teams. På den ska de namngivna konsulterna delta. Genomgången beräknas ta ca 30 minuter. Konsulterna ska finnas tillgängliga under angiven vecka. Kan konsulterna inte närvara kan de inte få något mervärde.
Skallkrav:
Kompetensnivå 3 (4-8 år).
Akademisk examen inom datavetenskap, systemutveckling eller motsvarande dokumenterad erfarenhet.
Minst 5 års erfarenhet av systemutveckling med Python som huvudspråk, med fokus på datapipelines, backend-tjänster och systemintegration.
Minst 3 års erfarenhet av ETL/ELT-utveckling mot SQL-databaser (t.ex. MySQL, MSSQL) samt object storage (t.ex. AWS S3, Ceph).
Minst 3 års erfarenhet av event-driven arkitektur och async message handling med Kafka, RabbitMQ eller motsvarande.
Minst 3 års erfarenhet av arbete med containerplattformar (Kubernetes/OpenShift) och CI/CD-lösningar (t.ex. Jenkins, Bamboo eller GitLab CI).
Minst 2 års erfarenhet av distributed data processing med Apache Spark, inklusive integration mot Data Lake platforms.
Dokumenterad erfarenhet av Apache Iceberg eller Delta Lake som open table format i en produktionsmiljö.
Dokumenterad erfarenhet av metadatadriven ETL-design och pipeline-ramverk i produktionsmiljö.
Dokumenterad erfarenhet av PII-anonymisering, kryptering eller hashing av känslig klinisk data i enlighet med regulatoriska krav i produktionsmiljö.
Dokumenterad erfarenhet av Trino eller motsvarande distributed SQL query engine mot Data Lake i produktionsmiljö.
Börkrav:
Erfarenhet av att utveckla datapipelines med Data Lake tekniker.
Självständigt ansvar för design och implementation av Data Lakearkitektur.
Erfarenhet av användning och konfigurering av monitoring m.m. för implementerad tjänst eller funktion i produktionsmiljö.
Självständigt ansvar för design och implementation av test- och quality assurance-ramverk för datapipelines i produktionsmiljö.
Erfarenhet av implementering av säkerhetslösningar.
Självständigt ansvar för design och implementation av säkerhetslösningar.
Återkom till oss senast 17/6 med nedan:
- CV på svenska där det tydligt framgår hur respektive krav uppfylls
- Timpris
- Om UK, bolags- och kontaktuppgifter
Tack på förhand!