Mediendateien durch Entfernen von Metadaten mit AWS Lambda sichern
Verbessere die Privatsphare und Sicherheit in verschiedenen Branchen durch das Entfernen von EXIF und anderen Metadaten aus hochgeladenen Bildern und Videos

In der heutigen digitalen Welt enthalten Bilder und Videos oft Metadaten, die eine uberraschende Menge an Informationen uber die Mediendatei preisgeben. Diese Metadaten, wie EXIF-Daten in Bildern, konnen sensible Details wie Standort, Gerateinformationen und mehr enthalten. Um die Privatsphare der Nutzer zu schutzen und die Sicherheit zu erhohen, konnen Unternehmen in verschiedenen Branchen davon profitieren, diese Metadaten aus Mediendateien zu entfernen. In diesem Blogbeitrag fuhren wir dich durch ein einfaches AWS Lambda-Skript, das automatisch Metadaten aus hochgeladenen Bildern und Videos in S3-Buckets entfernt.
Branchen, die profitieren konnen:
- Social-Media-Plattformen: Social-Media-Plattformen verarbeiten jeden Tag eine enorme Anzahl von Medien-Uploads. Durch das Entfernen von Metadaten aus Bildern und Videos konnen diese Plattformen die Privatsphare der Nutzer besser schutzen und das Risiko unbeabsichtigter Informationslecks minimieren.
- E-Commerce: E-Commerce-Websites zeigen oft nutzergenerierte Inhalte wie Produktbilder und Bewertungen an. Das Entfernen von Metadaten aus diesen Mediendateien stellt sicher, dass die privaten Informationen der Kunden nicht versehentlich offengelegt werden.
- Gesundheitswesen: Die Gesundheitsbranche verarbeitet sensible Patientendaten, einschliesslich Bildern und Videos von medizinischen Verfahren. Das Entfernen von Metadaten aus diesen Dateien ist unerlasslich, um die Datenschutzbestimmungen einzuhalten und die Vertraulichkeit der Patienten zu schutzen.
- Nachrichten und Medien: Journalisten und Medienorganisationen veroffentlichen Bilder und Videos, die sensible Informationen uber Quellen oder Standorte enthalten konnen. Das Entfernen von Metadaten kann helfen, diese Informationen zu schutzen und die Integritat ihrer Berichterstattung zu wahren.
- Bildung: Bildungseinrichtungen hosten und teilen oft verschiedene Mediendateien wie Vorlesungsvideos, Forschungsbilder und Studentenprasentationen. Das Entfernen von Metadaten aus diesen Dateien stellt sicher, dass private Informationen uber Studenten, Dozenten und Forschungssubjekte geschutzt werden.
import boto3
import io
import os
from PIL import Image
from moviepy.editor import *
def lambda_handler(event, _):
bucket_name = os.environ[‘S3_BUCKET_NAME’]
s3 = boto3.client(‘s3’)
object_name = event[‘Records’][0][‘s3’][‘object’][‘key’]
file_name, file_extension = os.path.splitext(object_name)
supported_image_extensions = ['.jpg', '.jpeg', '.png', '.tiff', '.tif', '.heic', '.heif']
supported_video_extensions = ['.mp4', '.mov', '.avi', '.mkv', '.webm']
image_data = s3.get_object(Bucket=bucket_name, Key=object_name)
if file_extension.lower() in supported_image_extensions:
with io.BytesIO(image_data['Body'].read()) as image_file:
image = Image.open(image_file)
image_format = image.format
with io.BytesIO() as new_image_data:
image.save(new_image_data, format=image_format)
new_image_data.seek(0)
s3.put_object(Bucket=bucket_name, Key=object_name, Body=new_image_data, Tagging='ExifDeleted=True')
elif file_extension.lower() in supported_video_extensions:
with io.BytesIO(image_data['Body'].read()) as video_file:
video = VideoFileClip(video_file)
with io.BytesIO() as new_video_data:
video.write_videofile(new_video_data, codec='libx264', audio_codec='aac')
new_video_data.seek(0)
s3.put_object(Bucket=bucket_name, Key=object_name, Body=new_video_data, Tagging='ExifDeleted=True')
Beachte, dass die Bibliotheken PIL und moviepy einige gemeinsam genutzte Bibliotheken benotigen, die in der Standard-Lambda-Umgebung moglicherweise nicht verfugbar sind. Du musst einen benutzerdefinierten Lambda-Layer erstellen, der beide gemeinsam genutzten Bibliotheken enthalt. Du kannst der offiziellen Anleitung folgen, um einen benutzerdefinierten Lambda-Layer fur FFmpeg zu erstellen.
Hier ist das Github-Repository: https://github.com/flightlesstux/EXIF-Metadata-Remover
Fazit
Das von uns bereitgestellte AWS Lambda-Skript macht es einfach, Metadaten aus Bildern und Videos zu entfernen, die in S3-Buckets hochgeladen werden, und verbessert so die Privatsphare und Sicherheit in einer Vielzahl von Branchen. Durch die Implementierung dieser Losung kannst du Benutzerinformationen schutzen, potenzielle Risiken reduzieren und die Einhaltung von Datenschutzbestimmungen gewahrleisten.
Weiteres von Ercan
Zwei weitere Seiten, gleicher Autor, anderes Terrain.
KI, LLMs, Agents, angewandte ML.
Praxisnotizen zu KI-Workloads. Bedrock-Kostenanalyse, Agent-Patterns, Vektorspeicher-Tradeoffs, Failure-Modes in Produktion.
Besuchen ercan.ai →Die Drehscheibe. Über mich, Beratung, Kontakt.
Persönliche Drehscheibe für beide Schreibspuren. Wer ich bin, wie die Beratung funktioniert, wie Sie mich erreichen.
Besuchen ercanermis.com →