Показать полную графическую версию : Странное поведение интеловских сетевых карт
sonny362
23-06-2022, 05:51
Добрый день. Сломал мозг: странно ведут себя интеловские сетевые карты.
Дано: домашний сервер (Дебиан) с набортной Intel 219V и клиентская машина с набортной Intel-225V (Win10, Win11, macOS).
Сначала конфигурация была такая.
1. На сервере 219V смотрит в интернет.
2. На сервере две PCI-карты Realtek, одна обычная, смотрит в LAN; ко второй, 2,5Gb (тоже Realtek) в режиме "точка-точка" подключен вышеописанный локальный комп (чтобы получить 2,5Gb, понятно).
Всё работало примерно полгода без проблем.
Недавно начались проблемы. Как увидел в логах, началось пару недель назад, но было эпизодически, и я не замечал их. А пару дней назад просто заблокировалась работа системы.
После изучения проблема выглядит так.
Если у меня на дебиане поднят интерфейс на 219V, то при каких-то условиях на клиентском компе с I225-V (у меня это проявлялось при загрузке файлов через облачный клиент или напрямую в облако через браузер) интерфейс на Дебиане валится:
Jun 19 16:39:49 avalon kernel: [179816.508769] e1000e 0000:00:1f.6 wan0: Detected Hardware Unit Hang: Jun 19 16:39:49 avalon kernel: [179816.508769] TDH <b6>
Jun 19 16:39:49 avalon kernel: [179816.508769] TDT <c8>
Jun 19 16:39:49 avalon kernel: [179816.508769] next_to_use <c8>
Jun 19 16:39:49 avalon kernel: [179816.508769] next_to_clean <b4>
Jun 19 16:39:49 avalon kernel: [179816.508769] buffer_info[next_to_clean]:
Jun 19 16:39:49 avalon kernel: [179816.508769] time_stamp <102acc9f1> Jun 19 16:39:49 avalon kernel: [179816.508769] next_to_watch <b6>
Jun 19 16:39:49 avalon kernel: [179816.508769] jiffies <102accb60> Jun 19 16:39:49 avalon kernel: [179816.508769] next_to_watch.status <0>
Jun 19 16:39:49 avalon kernel: [179816.508769] MAC Status <40080083>
Jun 19 16:39:49 avalon kernel: [179816.508769] PHY Status <796d>
Jun 19 16:39:49 avalon kernel: [179816.508769] PHY 1000BASE-T Status <3c00>
Jun 19 16:39:49 avalon kernel: [179816.508769] PHY Extended Status <3000>
Jun 19 16:39:49 avalon kernel: [179816.508769] PCI Status <10>
Если клиентский комп с I225-V спит - всё прекрасно работает.
Переключил локальный комп в роутер - проблема не ушла.
В итоге, перенастроил Дебиан, вывел из обращения интеловский интерфейс, один Реалтек смотрит в интернет, второй - в локалку. Сейчас всё нормально работает.
Осталось понять: что происходит?
На софтовые проблемы не похоже, поскольку эффект прооявляется на клиентской машине в трёх ОС одинаково. Единственное - я недавно обновлял БИОС на клиентской машине, возможно, это повлияло на работу сетевухи.
По моим прикидкам получается, что сетевуха на клиенте (225V) шлёт какие-то пакеты, вызывающие зависание сетевухи на сервере (219V).
Что посоветуете?
Jula0071
24-06-2022, 14:37
На софтовые проблемы не похоже, поскольку эффект прооявляется на клиентской машине в трёх ОС одинаково. Единственное - я недавно обновлял БИОС на клиентской машине, возможно, это повлияло на работу сетевухи.
По моим прикидкам получается, что сетевуха на клиенте (225V) шлёт какие-то пакеты, вызывающие зависание сетевухи на сервере (219V). »
Проблема комплексная и очень распространённая. Нет, там никаких магических пакетов смерти не шлётся, интерфейс просто валится под нагрузкой. С одной стороны i219 (и её родственники) - большая кака, это недосетевуха, с MAC, вынесенным в чипсет удешевления для. Но с другой, у неё заявлена поддержка checksum offload, однако, то ли памяти в этом огрызке не хватает, то ли ещё чего, в общем валится. Некоторым помогает выключить этот самый checksum offload, переложив функционал на цпу.
Что посоветуете? »
Почитайте этот длиннющий тред (https://forum.proxmox.com/threads/e1000-driver-hang.58284/page-8), попробуйте предложенный там обход проблемы - отключить оффлоады. Но лучше просто оставайтесь на реалтеках.
sonny362
24-06-2022, 18:07
Но лучше просто оставайтесь на реалтеках. »
Я уже подумал в эту сторону, спасибо.
На выходных перекоммутирую всё, чтобы один реалтек смотрел в интернет, второй (2,5) - на настольный комп, а 219-я - на локалку (где трафик небольшой).
Посмотрю - будут ли ханги.
Jula0071
25-06-2022, 12:35
sonny362, то есть, у вас 2,5 гбит упирались в 1 гбит на i219? Это могло оказаться причиной, в том смысле, что конечно отвала интерфейса не должно было случиться, но на такую нагрузку этот огрызок явно никто не рассчитывал и не тестировал. Любопытства ради, покажите выхлоп ethtool -k по всем интерфейсам.
sonny362
25-06-2022, 14:29
Jula0071, нет, всё было вот так:
ко второй, 2,5Gb (тоже Realtek) в режиме "точка-точка" подключен вышеописанный локальный комп (чтобы получить 2,5Gb, понятно). »
И полгода работало без нареканий.
Jula0071,
219V (сейчас висит в воздухе):
sudo ethtool -k tskwan0
Features for tskwan0:
rx-checksumming: on
tx-checksumming: on
tx-checksum-ipv4: off [fixed]
tx-checksum-ip-generic: on
tx-checksum-ipv6: off [fixed]
tx-checksum-fcoe-crc: off [fixed]
tx-checksum-sctp: off [fixed]
scatter-gather: on
tx-scatter-gather: on
tx-scatter-gather-fraglist: off [fixed]
tcp-segmentation-offload: on
tx-tcp-segmentation: on
tx-tcp-ecn-segmentation: off [fixed]
tx-tcp-mangleid-segmentation: off
tx-tcp6-segmentation: on
generic-segmentation-offload: on
generic-receive-offload: on
large-receive-offload: off [fixed]
rx-vlan-offload: on
tx-vlan-offload: on
ntuple-filters: off [fixed]
receive-hashing: on
highdma: on [fixed]
rx-vlan-filter: off [fixed]
vlan-challenged: off [fixed]
tx-lockless: off [fixed]
netns-local: off [fixed]
tx-gso-robust: off [fixed]
tx-fcoe-segmentation: off [fixed]
tx-gre-segmentation: off [fixed]
tx-gre-csum-segmentation: off [fixed]
tx-ipxip4-segmentation: off [fixed]
tx-ipxip6-segmentation: off [fixed]
tx-udp_tnl-segmentation: off [fixed]
tx-udp_tnl-csum-segmentation: off [fixed]
tx-gso-partial: off [fixed]
tx-tunnel-remcsum-segmentation: off [fixed]
tx-sctp-segmentation: off [fixed]
tx-esp-segmentation: off [fixed]
tx-udp-segmentation: off [fixed]
tx-gso-list: off [fixed]
fcoe-mtu: off [fixed]
tx-nocache-copy: off
loopback: off [fixed]
rx-fcs: off
rx-all: off
tx-vlan-stag-hw-insert: off [fixed]
rx-vlan-stag-hw-parse: off [fixed]
rx-vlan-stag-filter: off [fixed]
l2-fwd-offload: off [fixed]
hw-tc-offload: off [fixed]
esp-hw-offload: off [fixed]
esp-tx-csum-hw-offload: off [fixed]
rx-udp_tunnel-port-offload: off [fixed]
tls-hw-tx-offload: off [fixed]
tls-hw-rx-offload: off [fixed]
rx-gro-hw: off [fixed]
tls-hw-record: off [fixed]
rx-gro-list: off
macsec-hw-offload: off [fixed]
rx-udp-gro-forwarding: off
hsr-tag-ins-offload: off [fixed]
hsr-tag-rm-offload: off [fixed]
hsr-fwd-offload: off [fixed]
hsr-dup-offload: off [fixed]
Реалтек раз (1000):
sudo ethtool -k lan0
Features for lan0:
rx-checksumming: on
tx-checksumming: on
tx-checksum-ipv4: on
tx-checksum-ip-generic: off [fixed]
tx-checksum-ipv6: on
tx-checksum-fcoe-crc: off [fixed]
tx-checksum-sctp: off [fixed]
scatter-gather: off
tx-scatter-gather: off
tx-scatter-gather-fraglist: off [fixed]
tcp-segmentation-offload: off
tx-tcp-segmentation: off
tx-tcp-ecn-segmentation: off [fixed]
tx-tcp-mangleid-segmentation: off
tx-tcp6-segmentation: off
generic-segmentation-offload: off [requested on]
generic-receive-offload: on
large-receive-offload: off [fixed]
rx-vlan-offload: on
tx-vlan-offload: on
ntuple-filters: off [fixed]
receive-hashing: off [fixed]
highdma: on [fixed]
rx-vlan-filter: off [fixed]
vlan-challenged: off [fixed]
tx-lockless: off [fixed]
netns-local: off [fixed]
tx-gso-robust: off [fixed]
tx-fcoe-segmentation: off [fixed]
tx-gre-segmentation: off [fixed]
tx-gre-csum-segmentation: off [fixed]
tx-ipxip4-segmentation: off [fixed]
tx-ipxip6-segmentation: off [fixed]
tx-udp_tnl-segmentation: off [fixed]
tx-udp_tnl-csum-segmentation: off [fixed]
tx-gso-partial: off [fixed]
tx-tunnel-remcsum-segmentation: off [fixed]
tx-sctp-segmentation: off [fixed]
tx-esp-segmentation: off [fixed]
tx-udp-segmentation: off [fixed]
tx-gso-list: off [fixed]
fcoe-mtu: off [fixed]
tx-nocache-copy: off
loopback: off [fixed]
rx-fcs: off
rx-all: off
tx-vlan-stag-hw-insert: off [fixed]
rx-vlan-stag-hw-parse: off [fixed]
rx-vlan-stag-filter: off [fixed]
l2-fwd-offload: off [fixed]
hw-tc-offload: off [fixed]
esp-hw-offload: off [fixed]
esp-tx-csum-hw-offload: off [fixed]
rx-udp_tunnel-port-offload: off [fixed]
tls-hw-tx-offload: off [fixed]
tls-hw-rx-offload: off [fixed]
rx-gro-hw: off [fixed]
tls-hw-record: off [fixed]
rx-gro-list: off
macsec-hw-offload: off [fixed]
rx-udp-gro-forwarding: off
hsr-tag-ins-offload: off [fixed]
hsr-tag-rm-offload: off [fixed]
hsr-fwd-offload: off [fixed]
hsr-dup-offload: off [fixed]
Реалтек два (2500, сейчас смотрит в интернет):
sudo ethtool -k lan25
Features for lan25:
rx-checksumming: on
tx-checksumming: on
tx-checksum-ipv4: on
tx-checksum-ip-generic: off [fixed]
tx-checksum-ipv6: on
tx-checksum-fcoe-crc: off [fixed]
tx-checksum-sctp: off [fixed]
scatter-gather: off
tx-scatter-gather: off
tx-scatter-gather-fraglist: off [fixed]
tcp-segmentation-offload: off
tx-tcp-segmentation: off
tx-tcp-ecn-segmentation: off [fixed]
tx-tcp-mangleid-segmentation: off
tx-tcp6-segmentation: off
generic-segmentation-offload: off [requested on]
generic-receive-offload: on
large-receive-offload: off [fixed]
rx-vlan-offload: on
tx-vlan-offload: on
ntuple-filters: off [fixed]
receive-hashing: off [fixed]
highdma: on [fixed]
rx-vlan-filter: off [fixed]
vlan-challenged: off [fixed]
tx-lockless: off [fixed]
netns-local: off [fixed]
tx-gso-robust: off [fixed]
tx-fcoe-segmentation: off [fixed]
tx-gre-segmentation: off [fixed]
tx-gre-csum-segmentation: off [fixed]
tx-ipxip4-segmentation: off [fixed]
tx-ipxip6-segmentation: off [fixed]
tx-udp_tnl-segmentation: off [fixed]
tx-udp_tnl-csum-segmentation: off [fixed]
tx-gso-partial: off [fixed]
tx-tunnel-remcsum-segmentation: off [fixed]
tx-sctp-segmentation: off [fixed]
tx-esp-segmentation: off [fixed]
tx-udp-segmentation: off [fixed]
tx-gso-list: off [fixed]
fcoe-mtu: off [fixed]
tx-nocache-copy: off
loopback: off [fixed]
rx-fcs: off
rx-all: off
tx-vlan-stag-hw-insert: off [fixed]
rx-vlan-stag-hw-parse: off [fixed]
rx-vlan-stag-filter: off [fixed]
l2-fwd-offload: off [fixed]
hw-tc-offload: off [fixed]
esp-hw-offload: off [fixed]
esp-tx-csum-hw-offload: off [fixed]
rx-udp_tunnel-port-offload: off [fixed]
tls-hw-tx-offload: off [fixed]
tls-hw-rx-offload: off [fixed]
rx-gro-hw: off [fixed]
tls-hw-record: off [fixed]
rx-gro-list: off
macsec-hw-offload: off [fixed]
rx-udp-gro-forwarding: off
hsr-tag-ins-offload: off [fixed]
hsr-tag-rm-offload: off [fixed]
hsr-fwd-offload: off [fixed]
hsr-dup-offload: off [fixed]
Jula0071
25-06-2022, 14:50
нет, всё было вот так: »
Имел в виду что на локальный интерфейс приходит 2,5 гбит, а на внешнем-то 1.
Забавно, на реалтеках tso off, gso off, sg off, видимо у них похожая болячка (карты-то тоже третий сорт), но в драйвере принудительно включили обход. А может просто нет этого функционала.
sonny362
25-06-2022, 18:59
на локальный интерфейс приходит 2,5 гбит, а на внешнем-то 1. »
Ну у меня основной трафик между компом и самим сервером без выхода наружу, так что нагрузку на 219-й создавать не должно было. По идее.
Впрочем, сервер действительно собран из бюджетных комплектующих (включая материнку), и мало ли как это всё поведёт себя при нагрузке.
В общем, завтра вернусь домой, попробую подключить в новой конфигурации. Наверное, сразу отключу tso и gso, а там будем смотреть.
sonny362
26-06-2022, 15:29
Перекоммутировал всё, как планировал, убрал интеловскую 219V с "магистрали" на WiFi сеть.
На всякий случай поотключал tso и gso. Полдня полёт нормальный, хангов нет.
Jula0071
27-06-2022, 18:22
Нагрузочные тесты делали? iperf или что-то подобное
sonny362
28-06-2022, 06:05
Jula0071, пока нет, руки не дошли.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.