Systemmails kommen nicht mehr an

  • Hallo,


    Sytemmails von meinem vServer hier bei Netcup (Logwatch, div. Mails nach Ausführung von Cronjobs etc) kommen seit ca. einer Woche nicht mehr an.

    Stauen sich alle im Mail Queue.


    Mail.log sagt nur das:


    process /usr/lib/postfix/sbin/smtp pid 442027 killed by signal 11
    Feb 18 19:08:10 xy postfix/qmgr[238695]: warning: transport smtp failure -- see a previous warning/fatal/panic logfile record for the problem description
    Feb 18 19:08:10 xc postfix/error[442044]: 8BE7721412: to=<bla@bla.de>, relay=none, delay=41829, delays=41804/25/0/0, dsn=4.3.0, status=deferred (unknown mail transport error)


    Sagt das jemandem was oder hat jemand Tips? Wissentlich wurde nichts geändert...


    Danke

  • Signal 11 ist SIGSEGV, salopp gesagt stürzt der smtp Prozess ab. Dieser Prozess stellt die Verbindung zum anderen Mailserver her und versendet die Mail schlussendlich.


    Die übliche Frage zum Anfang: Hast du den Postfix-Service schon mal neu gestartet, um z.B. ein teilweises Update ausschließen zu können? Kannst du den Absturz auch bei Mails an andere Empfänger beobachten? Sind Coredumps vorhanden, die die Absturzursache klären könnten? (coredumpctl falls systemd genutzt wird).


    Das sind meine ersten Ideen zu diesem Problem.

  • ich hatte ein ähnliches Problem weil die mail(Logwatch) zu gross war , über 50 MB

    vielleicht ist das bei dir auch der Fall?

    It's me, only me, pure michi 🦆

    RS 1000 SAS G8 | Cyber Quack

    VPS: 50 G7 |B Ostern 2017|200 | Karneval | piko

    WH: SmallEi | Adv17 Family |4000 SE|1000 SE

  • Danke schon mal an alle.

    systemdwird nicht genutzt

    Es werden über postfix nur die Systemmails versendet. Keinerlei anderen Mails. Server hat sonst keine Mailkonten.

    Logwatch Mails sind zwar groß (immer ca . 5MB) aber nicht so groß.

  • Das kommt dabei raus:

    postfix/postfix-script: warning: symlink leaves directory: /etc/postfix/./makedefs.out

    Das ist eine Warnmeldung die nicht weiter schlimm ist. Zumindest ist die nicht für den Prozessabsturz verantwortlich.

    Gibt es sonst irgendwelche Cronjobs etc., welche den Postfix Service triggern. Logrotate oder so?

  • Um die Absturzursache einzugrenzen schlage ich ein paar Tests vor:


    Versuche zum Beispiel mit sendmail eine Mail an einen anderen Empfänger zu verschicken. Damit möchte ich herausfinden, ob der smtp-Prozess auch bei Verbindungen zu anderen Mailservern abstürzt, oder es irgendwie an der Kommunikation bei den Systemmails liegt.


    Außerdem könnte es helfen mehr Logging zu aktivieren. Ein Weg ist das -v Flag an den smtp Prozess in master.cf anzuhängen. Vielleicht gibt uns das einen Tipp was kurz vor dem Absturz passiert.

    Making Postfix daemon programs more verbose

    Append one or more "-v" options to selected daemon definitions in /etc/postfix/master.cf and type "postfix reload". This will cause a lot of activity to be logged to the syslog daemon. For example, to make the Postfix SMTP server process more verbose:

    Code
    /etc/postfix/master.cf:    smtp      inet  n       -       n       -       -       smtpd -v

    To diagnose problems with address rewriting specify a "-v" option for the cleanup(8) and/or trivial-rewrite(8) daemon, and to diagnose problems with mail delivery specify a "-v" option for the qmgr(8) or oqmgr(8) queue manager, or for the lmtp(8), local(8), pipe(8), smtp(8), or virtual(8) delivery agent.

  • Sorry bin erst jetzt dazu gekommen.


    Habe eine Test mail mit

    Code
    echo "Subject: sendmail test" | sendmail -v my@email.com

    geschickt. Bleibt auch hängen und kommt nicht an.


    Das erweiterte logging hab ich eingechaltet. Da kommen aber leider keine weiteren Fehlermeldungen

  • Ist mail.log das einzige bei dir aktive Log, wie sieht es mit mail.err, mail.warn aus?

    Eine mail.warn gibt es nicht. Mail.err ist leer.

    Im Mail.log nur das hier:


    Feb 26 15:24:35 mein-server postfix/qmgr[436133]: warning: private/smtp socket: malformed response

    Feb 26 15:24:35 mein-server postfix/qmgr[436133]: warning: transport smtp failure -- see a previous warning/fatal/panic logfile record for the problem description

    Feb 26 15:24:35 mein-server postfix/master[436084]: warning: process /usr/lib/postfix/sbin/smtp pid 463536 killed by signal 11

    Feb 26 15:24:35 mein-server postfix/master[436084]: warning: /usr/lib/postfix/sbin/smtp: bad command startup -- throttling

  • Feb 26 15:24:35 mein-server postfix/qmgr[436133]: warning: private/smtp socket: malformed response

    Das klingt mir nach einem fehlerhaften Handshake. Ist im Maillog zu der angegebenen Zeit eine externe Anfrage an den Postfix zu sehen. Also ich meine, wurde zu der Zeit gerade versucht eine Mail an Postfix zu übergeben?

    Nach einem unkontrollierten Service Shutdown sieht es zumindest nicht aus.

    kommen seit ca. einer Woche nicht mehr an.

    Stauen sich alle im Mail Queue.

    Ist vielleicht das im Postfix hinterlegte SSL Zertifikat buggy. Wurde das zu der Zeit erneuert?

  • Ich denke, dass diese Meldung nur eine Folge aus dem Absturz des smtp Prozesses ist. Der Socket zwischen qmgr und smtp wird unvermittelt geschlossen wodurch qmgr einen Fehler loggt. Eine externe Anfrage erreicht den abstürzenden smtp Prozess nicht, dafür sind andere Prozesse zuständig.

    Feb 26 15:24:35 mein-server postfix/qmgr[436133]: warning: private/smtp socket: malformed response

    Ich sehe gerade, dass ich oben einen Fehler gemacht habe, denn die Option -v sollte in master.cf nicht beim smtpd sondern bei smtp angegeben werden. Kannst du das bitte nochmal prüfen? (smtp: SMTP-Client zum Senden von Mails, smtpd: SMTP-Server zum Emfangen von Mails)


    Ansonsten wäre ein Coredump bestimmt aufschlussreich. Das ist zwar die Holzhammer-Methode, aber was anderes fällt mir nicht wirklich ein. Weißt du wie du an einen Coredump kommen kannst?

  • mit smtp -v hab ich ich jetzt ein paar mehr Einträge


    Feb 27 22:20:24 mein-server postfix/postfix-script[511399]: fatal: cannot execute /usr/sbin/postconf!

    Feb 27 22:20:27 mein-server postfix/postqueue[511426]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:20:37 mein-server postfix/postqueue[511427]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:20:47 mein-server postfix/postqueue[511431]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:20:57 mein-server postfix/postqueue[511439]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:21:07 mein-server postfix/postqueue[511443]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:21:42 mein-server postfix/postqueue[511479]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:22:12 mein-server postfix/postqueue[511480]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:22:42 mein-server postfix/postqueue[511481]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:23:12 mein-server postfix/postqueue[511489]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:23:42 mein-server postfix/postqueue[511502]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:24:37 mein-server postfix/postqueue[511516]: fatal: Queue report unavailable - mail system is down


    Feb 27 22:21:08 mein-server postfix/postqueue[511444]: warning: Mail system is down -- accessing queue directly


    Mit coredumps hab ich mich bisher nicht beschäftigt

  • mit smtp -v hab ich ich jetzt ein paar mehr Einträge

    "Feb 27 22:23:42 mein-server postfix/postqueue[511502]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:24:37 mein-server postfix/postqueue[511516]: fatal: Queue report unavailable - mail system is down

    Feb 27 22:21:08 mein-server postfix/postqueue[511444]: warning: Mail system is down -- accessing queue directly"

    Mit coredumps hab ich mich bisher nicht beschäftigt

    Was sagt den /etc/init.d/postfix status bzw start und das auf das "start" folgende journalctl -xe ?
    "system down" müsste ja erstmal behoben werden bevor Mails rausgehen sollen denke ich?

    sambi@theserv$ make love
    make: don’t know how to make ‚love‘.

  • Das wird mir angezeigt:


    ● postfix.service - Postfix Mail Transport Agent

         Loaded: loaded (/lib/systemd/system/postfix.service; enabled; vendor preset: enabled)

         Active: active (exited) since Thu 2023-03-02 23:17:13 CET; 3 days ago

       Main PID: 1638 (code=exited, status=0/SUCCESS)

          Tasks: 0 (limit: 9440)

         Memory: 0B

         CGroup: /system.slice/postfix.service

    Mär 02 23:17:13 mein-system.de systemd[1]: Starting Postfix Mail Transport Agent...

    Mär 02 23:17:13 mein-system.de systemd[1]: Finished Postfix Mail Transport Agent.

    -- A start job for unit packagekit.service has begun execution.

    --

    -- The job identifier is 26046.

    Mär 06 22:34:27 mein-system.de PackageKit[283803]: daemon start

    Mär 06 22:34:27 mein-system.de dbus-daemon[970]: [system] Successfully activated service 'org.freedesktop.PackageKit'

    Mär 06 22:34:27 mein-system.de systemd[1]: Started PackageKit Daemon.

    -- Subject: A start job for unit packagekit.service has finished successfully

    -- Defined-By: systemd

    -- Support: http://www.ubuntu.com/support

    --

    -- A start job for unit packagekit.service has finished successfully.

    --

    -- The job identifier is 26046.

    Mär 06 22:34:35 mein-system.de sudo[282648]: pam_unix(sudo:session): session closed for user root

    Mär 06 22:34:35 mein-system.de sudo[283883]:     root : TTY=pts/0 ; PWD=/home/test ; USER=root ; COMMAND=/usr/bin/apt -y upgrade

    Mär 06 22:34:35 mein-system.de sudo[283883]: pam_unix(sudo:session): session opened for user root by test(uid=0)

    Mär 06 22:34:54 mein-system.de systemd[1]: Reloading.

    Mär 06 22:34:55 mein-system.de systemd-udevd[684]: Network interface NamePolicy= disabled on kernel command line, ignoring.

    Mär 06 22:34:55 mein-system.de systemd[1]: Starting Daily apt download activities...

    -- Subject: A start job for unit apt-daily.service has begun execution

    -- Defined-By: systemd

    -- Support: http://www.ubuntu.com/support

    --

    -- A start job for unit apt-daily.service has begun execution.

    --

    -- The job identifier is 26132.

    Mär 06 22:34:56 mein-system.de audit[284041]: AVC apparmor="STATUS" operation="profile_replace" profile="unconfined" name="/usr/sbin/tcpdump" pid=284041 comm="apparmor_parser"

    Mär 06 22:34:56 mein-system.de kernel: kauditd_printk_skb: 14 callbacks suppressed

    Mär 06 22:34:56 mein-system.de kernel: audit: type=1400 audit(1678138496.432:26): apparmor="STATUS" operation="profile_replace" profile="unconfined" name="/usr/sbin/tcpdump" pid=284041 comm="apparmor_parser"

    Mär 06 22:34:56 mein-system.de systemd[1]: apt-daily.service: Succeeded.

    -- Subject: Unit succeeded

    -- Defined-By: systemd

    -- Support: http://www.ubuntu.com/support

    --

    -- The unit apt-daily.service has successfully entered the 'dead' state.

    Mär 06 22:34:56 mein-system.de systemd[1]: Finished Daily apt download activities.

    -- Subject: A start job for unit apt-daily.service has finished successfully

    -- Defined-By: systemd

    -- Support: http://www.ubuntu.com/support

    --

    -- A start job for unit apt-daily.service has finished successfully.

    --

    -- The job identifier is 26132.

    Mär 06 22:34:56 mein-system.de systemd[1]: Reloading.

    Mär 06 22:34:58 mein-system.de systemd-udevd[684]: Network interface NamePolicy= disabled on kernel command line, ignoring.

    Mär 06 22:34:58 mein-system.de systemd[1]: Reloading.

    Mär 06 22:34:59 mein-system.de systemd[1]: Reloading.

    Mär 06 22:35:01 mein-system.de CRON[284150]: pam_unix(cron:session): session opened for user www-data by (uid=0)

    Mär 06 22:35:01 mein-system.de CRON[284152]: (www-data) CMD (php -f /var/www/nextcloud/cron.php > /dev/null 2>&1)

    Mär 06 22:35:01 mein-system.de systemd[1]: Condition check resulted in fast remote file copy program daemon being skipped.

    -- Subject: A start job for unit rsync.service has finished successfully

    -- Defined-By: systemd

    -- Support: http://www.ubuntu.com/support

    --

    -- A start job for unit rsync.service has finished successfully.

    --

    -- The job identifier is 26219.

    Mär 06 22:35:01 mein-system.de systemd[1]: Reloading.

    Mär 06 22:35:02 mein-system.de CRON[284150]: pam_unix(cron:session): session closed for user www-data

    Mär 06 22:35:03 mein-system.de systemd-udevd[684]: Network interface NamePolicy= disabled on kernel command line, ignoring.

    Mär 06 22:35:05 mein-system.de sudo[283883]: pam_unix(sudo:session): session closed for user root

    Mär 06 22:35:05 mein-system.de sudo[284416]:     root : TTY=pts/0 ; PWD=/home/test ; USER=root ; COMMAND=/usr/bin/apt -y dist-upgrade

    Mär 06 22:35:05 mein-system.de sudo[284416]: pam_unix(sudo:session): session opened for user root by test(uid=0)

    Mär 06 22:35:06 mein-system.de sudo[284416]: pam_unix(sudo:session): session closed for user root

    Mär 06 22:35:06 mein-system.de sudo[284434]:     root : TTY=pts/0 ; PWD=/home/test ; USER=root ; COMMAND=/usr/bin/apt autoclean -y

    Mär 06 22:35:06 mein-system.de sudo[284434]: pam_unix(sudo:session): session opened for user root by test(uid=0)

    Mär 06 22:35:07 mein-system.de sudo[284434]: pam_unix(sudo:session): session closed for user root

    Mär 06 22:35:07 mein-system.de sudo[284438]:     root : TTY=pts/0 ; PWD=/home/test ; USER=root ; COMMAND=/usr/bin/apt autoremove -y

    Mär 06 22:35:07 mein-system.de sudo[284438]: pam_unix(sudo:session): session opened for user root by test(uid=0)

    Mär 06 22:35:08 mein-system.de sudo[284438]: pam_unix(sudo:session): session closed for user root

  • Hi,


    also was komisch ist:


    Code
    Mär 02 23:17:13 mein-system.de systemd[1]: Starting Postfix Mail Transport Agent.
    Mär 02 23:17:13 mein-system.de systemd[1]: Finished Postfix Mail Transport Agent.


    Kannst Du hier mal einen Auszug von:

    grep -C8 -r "Starting Postfix Mail Transport Agent" daemon.log


    senden?

    Vorher alle Systeminfos wie ip usw. entfernen :)

    sambi@theserv$ make love
    make: don’t know how to make ‚love‘.

  • Gibts anscheinend nicht:(

    grep: daemon.log: No such file or directory