← Zurück zum E-Mail Extractor
Warum Webseiten E-Mail-Adressen enthalten
Webseiten sind eine der reichhaltigsten Quellen für öffentlich geteilte E-Mail-Adressen. Kontaktinformationen finden sich an vielen Stellen:
- Kontaktseiten – fast jede Website hat eine Kontaktseite mit mindestens einer E-Mail-Adresse.
- Footer-Bereiche – viele Websites zeigen eine allgemeine Kontakt-E-Mail im seitenweiten Fußbereich.
- Über-uns- und Team-Seiten – Firmenwebsites listen oft individuelle E-Mail-Adressen für Teammitglieder auf.
- Stellenangebote – Karriereseiten enthalten häufig eine HR- oder Recruiter-E-Mail.
- Impressum – in Deutschland und vielen europäischen Ländern sind Unternehmen gesetzlich verpflichtet, Kontaktdaten im Impressum zu veröffentlichen.
- Blog-Beiträge und Artikel – Autorenbiografien und Pressemitteilungen enthalten oft E-Mail-Adressen.
Methode 1: Kopieren und Einfügen von einer Webseite
- Navigiere zur Webseite mit den E-Mail-Adressen.
- Markiere den gesamten Text mit Strg+A und kopiere ihn mit Strg+C.
- Gehe zu extract-emails.com/de und füge den Text ein.
- Das Tool erkennt sofort alle E-Mail-Adressen im eingefügten Text.
Einschränkung: Diese Methode erfasst nur sichtbaren Text. E-Mail-Adressen in mailto:-Links hinter Buttons werden möglicherweise nicht erfasst.
Methode 2: Unser browserbasiertes Tool (Empfohlen)
Für beste Ergebnisse verwende den HTML-Quelltext:
- Zeige den Seitenquelltext an mit Strg+U.
- Kopiere den gesamten Quelltext.
- Füge ihn in unser Tool ein.
- Das Tool findet alle E-Mail-Adressen – auch solche in
mailto:-Links, Meta-Tags und JavaScript-Variablen.
Datenschutz: Die gesamte Verarbeitung erfolgt lokal in deinem Browser. Keine Daten werden an Server gesendet.
Methode 3: Python mit Beautiful Soup
Abhängigkeiten installierenpip install beautifulsoup4 requests
E-Mails von einer URL extrahieren
import re
import requests
from bs4 import BeautifulSoup
def emails_von_url_extrahieren(url):
antwort = requests.get(url, timeout=10)
soup = BeautifulSoup(antwort.text, "html.parser")
# Sichtbaren Text extrahieren
text = soup.get_text()
# Auch mailto:-Links pruefen
for link in soup.find_all("a", href=True):
if link["href"].startswith("mailto:"):
text += " " + link["href"].replace("mailto:", "")
pattern = r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}'
emails = list(set(re.findall(pattern, text)))
return sorted(emails)
# Beispiel
emails = emails_von_url_extrahieren("https://beispiel.de/kontakt")
for email in emails:
print(email)
Mehrere Seiten crawlen
import re
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin, urlparse
def website_crawlen(start_url, max_seiten=50):
domain = urlparse(start_url).netloc
besucht = set()
zu_besuchen = [start_url]
alle_emails = set()
pattern = r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}'
while zu_besuchen and len(besucht) < max_seiten:
url = zu_besuchen.pop(0)
if url in besucht:
continue
besucht.add(url)
try:
antwort = requests.get(url, timeout=10)
soup = BeautifulSoup(antwort.text, "html.parser")
text = soup.get_text()
emails = re.findall(pattern, text)
alle_emails.update(emails)
for link in soup.find_all("a", href=True):
href = link["href"]
if href.startswith("mailto:"):
email = href.replace("mailto:", "").split("?")[0]
alle_emails.add(email)
else:
volle_url = urljoin(url, href)
if urlparse(volle_url).netloc == domain:
zu_besuchen.append(volle_url)
print(f"Besucht: {url} ({len(emails)} E-Mails)")
except Exception as e:
print(f"Fehler: {url} - {e}")
return sorted(alle_emails)
emails = website_crawlen("https://beispiel.de")
print(f"\nInsgesamt {len(emails)} eindeutige E-Mails")
for email in emails:
print(email)
Rechtliche und ethische Hinweise
- robots.txt beachten: Viele Websites definieren Crawling-Regeln in ihrer
robots.txt. - Rate Limiting: Füge Wartezeiten (1–2 Sekunden) zwischen Anfragen ein.
- DSGVO-Konformität: Eine öffentlich sichtbare E-Mail-Adresse berechtigt nicht automatisch zur Nutzung für Marketing. Lies unseren DSGVO-Guide.
- Nutzungsbedingungen: Viele Websites verbieten automatisiertes Scraping in ihren AGB.
- Extraktion vs. Harvesting: E-Mails von der eigenen Website zu extrahieren ist etwas anderes als Massen-Harvesting im Internet.
Tipps für beste Ergebnisse
- HTML-Quelltext prüfen. Viele E-Mail-Adressen sind hinter Buttons oder in Scripts versteckt.
- Relevante Seiten zuerst. Kontakt-, Impressum-, Team- und Über-uns-Seiten enthalten die meisten E-Mails.
- Ergebnisse validieren. Platzhalter wie
beispiel@example.comherausfiltern. - Unser Tool für schnelle Ergebnisse. Für wenige Seiten ist Kopieren und Einfügen schneller als ein Skript.
E-Mails von jeder Webseite extrahieren
Text oder HTML-Quelltext einfügen – unser kostenloses Tool findet sofort jede E-Mail-Adresse.
E-Mail Extractor öffnen