Innovation
Responsable de l'Unité Exploitation
Département : Digital Factory
Rattachement hiérarchique : Responsable Digital Factory
Supervision : Ingénieurs DevOps, Administrateurs Systèmes, Administrateurs Réseaux, Support technique
Lieu du travail : Agence Togo Digital (ATD)
Nombre de personnes à recruter : 1
Mission principale
- Le Responsable de l’Unité Exploitation est chargé de garantir la disponibilité, la stabilité, la sécurité et la performance des plateformes numériques opérées par l’Agence.
- Il/elle supervise l’exploitation technique quotidienne, organise les opérations de production, et veille au respect des engagements de service pour les systèmes utilisés par les citoyens et les administrations.
- Il/elle est le garant du bon fonctionnement technique des services en production.
Responsabilités
1. Supervision des opérations techniques
- Assurer le bon fonctionnement des plateformes en production
- Superviser les infrastructures (serveurs, cloud, réseaux, applications)
- Garantir la disponibilité et la continuité de service
- Assurer la gestion des incidents techniques
2. Gestion de l’équipe exploitation
- Encadrer les ingénieurs DevOps et administrateurs systèmes
- Organiser les astreintes et permanences
- Définir les procédures d’exploitation
- Développer les compétences de l’équipe
3. Gestion des mises en production
- Superviser les déploiements en production
- Valider les mises en production
- Assurer la coordination avec les équipes de développement
4. Supervision et monitoring
- Mettre en place et suivre les outils de supervision
- Analyser les incidents et mettre en œuvre des actions correctives
- Produire des rapports de disponibilité et de performance (incl les indicateurs tels que la disponibilité des plateformes, les taux d’incidents, le temps de résolution, etc.)
5. Sécurité et continuité de service
- Garantir la sécurité des systèmes en exploitation
- Superviser les sauvegardes
- Assurer les plans de reprise d’activité (PRA)
- Assurer les plans de continuité (PCA)
6. Mise en place des processus d’exploitation
- Définir et améliorer les procédures d’exploitation, de gestion des incidents, de gestion des changements, de gestion des accès.
7. Coordination avec les autres directions
- Collaborer de manière étroite avec les équipes d’architectes, de responsables produits, de projets et de chargé du support pour offrir un produit de qualité simple à l’usage.
Compétences techniques requises
- Avoir des connaissances avérées sur les différents systèmes d’exploitation y compris Linux
- Avoir les connaissances requies pour la gestion d’un cloud sur site, ou des cloud AWS, Azure, OVH ou équivalent
- Etre familier avec les plateformes Kubernetes, les Docker, les développements CI/CD,
- Être familier avec les plateformes ou outils à l’instar de Grafana, Prometheus et/ou ELK
- Avoir une bonne connaissance sur les processus de déploiement et de maintien des Réseaux et des serveurs.
Compétences managériales
- Management d’équipe technique
- Gestion de crise
- Organisation
- Leadership
- Prise de décision
Qualifications
- Diplôme : Minimum un Bac+5 en informatique, réseaux et système, télécommunication
- Expérience : Minimum 5 ans d’expérience technique dont 3 ans en gestion de l’exploitation de plateforme critique d’envergure nationale
- Langues : Maîtrise du français (écrit et oral), la maîtrise de l'anglais est un atout.
- Analyste de données
- Architecte d'Entreprise
- Assistant(e) de Direction
- Développeur Frontend
- Développeur Fullstack
- Chargé des Ressources Humaines
- Chargé de Communication Institutionnelle
- Juriste IT
- Développeur Odoo
- Responsable des Opérations
- Responsable Produit
- Responsable Qualité Assurance (QA)
- Développeur Rust / Backend Engineer Rust
- Scrum Master
- Chef de Projet IT DevOps Senior
- Chef de Projet IT Infrastructure Senior
- Chef de Projet IT Système Senior
- Architecte Solutions
- Intégrateur Systèmes
- Responsable de la Livraison Technique
- Responsable Formation
- UX/UI Designer
- UX Writer / Spécialiste en Microcopy