eadl:bloc4:fm4:s3

Amazon S3 – stockage objet

Amazon S3 (Simple Storage Service) est un service de stockage d’objets. Contrairement à un disque classique (système de fichiers), S3 ne stocke pas des fichiers dans des dossiers, mais des objets dans des conteneurs appelés buckets.

L’objectif de S3 est de fournir :

  • un stockage massif
  • hautement durable
  • accessible via Internet
  • sécurisé et contrôlable finement

Un bucket est un conteneur de stockage.

Caractéristiques :

  • nom unique au niveau mondial
  • lié à une région AWS
  • point d’entrée pour accéder aux objets

Un objet est l’unité de base dans S3.

Un objet est composé de :

  • données (le contenu du fichier)
  • une clé (identifiant unique dans le bucket)
  • des métadonnées

Exemple :

  • clé : images/photo.jpg
  • contenu : image
  • métadonnées : type, taille, date

Important : Il n’existe pas de vraie hiérarchie de dossiers. Les chemins sont simulés via le nom de la clé.


C’est le modèle classique :

  • stockage multi-AZ
  • très haute durabilité
  • usage général

Caractéristiques :

  • latence très faible
  • organisation en répertoires
  • stockage dans une seule zone de disponibilité

Usage :

  • applications nécessitant des accès très rapides
  • traitements intensifs (IA, analytics)

Limite :

  • résilience plus faible (une seule zone)

Permet de stocker des données tabulaires optimisées pour l’analyse.

Usage :

  • data lake
  • moteurs analytiques

Permet de stocker des vecteurs (embeddings).

Usage :

  • intelligence artificielle
  • recherche sémantique

S3 propose plusieurs classes pour optimiser les coûts :

  • Standard : accès fréquent
  • Intelligent-Tiering : adaptation automatique
  • Standard-IA : accès peu fréquent
  • One Zone-IA : moins cher, moins résilient
  • Glacier : archivage
  • Glacier Deep Archive : archivage long terme

Principe : Plus l’accès est rare, plus le stockage est économique, mais plus l’accès est lent.


La sécurité dans S3 repose sur plusieurs couches.

Permet de définir :

  • qui accède
  • à quelles ressources
  • avec quels droits

Règles appliquées directement au bucket.

Exemples :

  • autoriser une IP
  • autoriser CloudFront
  • interdire l’accès public

Mécanisme global permettant d’éviter toute exposition accidentelle.

Bonne pratique : Toujours activer ce mécanisme par défaut.

Chaque utilisateur ne doit avoir que les droits nécessaires.


Les données circulent via HTTPS.

Trois modes principaux :

  • SSE-S3 : clés gérées par AWS
  • SSE-KMS : clés gérées via AWS KMS (recommandé)
  • SSE-C : clés fournies par le client
  • activer le chiffrement par défaut
  • utiliser KMS pour données sensibles
  • contrôler l’accès aux clés

Permet de conserver plusieurs versions d’un objet.

Avantages :

  • récupération après suppression accidentelle
  • historique des modifications

Inconvénient :

  • augmentation des coûts

Permet d’automatiser :

  • transition entre classes de stockage
  • suppression des objets

Exemple :

  • 30 jours → Standard-IA
  • 90 jours → Glacier
  • 365 jours → suppression

Deux types :

  • SRR (Same Region Replication)
  • CRR (Cross Region Replication)

Objectifs :

  • résilience
  • conformité
  • performance

Trace les actions effectuées sur S3 :

  • qui a fait quoi
  • quand

Trace les accès aux objets.

Permet :

  • surveillance
  • alertes

Via :

  • API REST
  • CLI
  • SDK

Un objet peut être accessible publiquement si autorisé.

Permet de donner un accès temporaire sécurisé à un objet.


S3 peut déclencher des actions lors d’événements :

  • upload de fichier
  • suppression

Intégrations :

  • AWS Lambda
  • SNS
  • SQS

  • durabilité : 99.999999999%
  • stockage sur plusieurs zones

Différence :

  • durabilité = ne pas perdre les données
  • disponibilité = pouvoir y accéder

  • activer le chiffrement
  • activer le versioning
  • bloquer l’accès public
  • utiliser IAM correctement
  • mettre en place lifecycle policies
  • activer les logs
  • surveiller les accès

  • bucket public involontaire
  • permissions trop larges
  • absence de logs
  • coûts non maîtrisés
  • absence de stratégie de cycle de vie

Amazon S3 est un service simple en apparence, mais puissant.

Sa maîtrise repose sur :

  • la compréhension du modèle objet
  • la gestion des accès
  • la sécurisation des données
  • l’optimisation des coûts
  • l’automatisation

S3 est au cœur de la majorité des architectures Cloud modernes.

  • eadl/bloc4/fm4/s3.txt
  • Dernière modification : il y a 21 heures
  • de jcheron