Frage Cryptic Kernel "Seitenzuordnungsfehler" Nachrichten interpretieren


Ich habe ein CentOS 6.1-Datenbanksystem für mehrere Benutzer, auf dem eine Anwendung namens ABC läuft. Der Server ist 64-Bit, 8 GB RAM und 6 vCPU (auf VMWare ESXi 4). Wir erhalten häufige Dumps in den dmesg und die Systemprotokolle zeigen Fehler bei der Kernel-Seitenzuordnung auf.

Was bedeuten diese Nachrichten in diesem Zusammenhang? Wie können wir das beheben?

Feb  5 08:10:52 Fruity kernel: ABC: page allocation failure. order:1, mode:0x20
Feb  5 08:10:52 Fruity kernel: Pid: 23588, comm: ABC Not tainted 2.6.32-131.17.1.el6.x86_64 #1
Feb  5 08:10:52 Fruity kernel: Call Trace:
Feb  5 08:10:52 Fruity kernel: <IRQ>  [<ffffffff8112016e>] ? __alloc_pages_nodemask+0x71e/0x8b0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81159a52>] ? kmem_getpages+0x62/0x170
Feb  5 08:10:52 Fruity kernel: [<ffffffff8115a66a>] ? fallback_alloc+0x1ba/0x270
Feb  5 08:10:52 Fruity kernel: [<ffffffff8115a0bf>] ? cache_grow+0x2cf/0x320
Feb  5 08:10:52 Fruity kernel: [<ffffffff8115a3e9>] ? ____cache_alloc_node+0x99/0x160
Feb  5 08:10:52 Fruity kernel: [<ffffffff8115b1ab>] ? kmem_cache_alloc+0x11b/0x190
Feb  5 08:10:52 Fruity kernel: [<ffffffff81411ba8>] ? sk_prot_alloc+0x48/0x1a0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81411e12>] ? sk_clone+0x22/0x2c0
Feb  5 08:10:52 Fruity kernel: [<ffffffff8145caf6>] ? inet_csk_clone+0x16/0xd0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81475be3>] ? tcp_create_openreq_child+0x23/0x450
Feb  5 08:10:52 Fruity kernel: [<ffffffff814735cd>] ? tcp_v4_syn_recv_sock+0x4d/0x2a0
Feb  5 08:10:52 Fruity kernel: [<ffffffff814759a1>] ? tcp_check_req+0x201/0x420
Feb  5 08:10:52 Fruity kernel: [<ffffffff8146b4b6>] ? tcp_rcv_state_process+0x116/0xa30
Feb  5 08:10:52 Fruity kernel: [<ffffffff8105055a>] ? enqueue_entity+0x13a/0x340
Feb  5 08:10:52 Fruity kernel: [<ffffffff81472feb>] ? tcp_v4_do_rcv+0x35b/0x430
Feb  5 08:10:52 Fruity kernel: [<ffffffff81474760>] ? tcp_v4_rcv+0x4e0/0x860
Feb  5 08:10:52 Fruity kernel: [<ffffffff8105dc32>] ? default_wake_function+0x12/0x20
Feb  5 08:10:52 Fruity kernel: [<ffffffff8145247d>] ? ip_local_deliver_finish+0xdd/0x2d0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81452708>] ? ip_local_deliver+0x98/0xa0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81451bcd>] ? ip_rcv_finish+0x12d/0x440
Feb  5 08:10:52 Fruity kernel: [<ffffffff8104fc08>] ? update_curr+0xf8/0x1e0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81452155>] ? ip_rcv+0x275/0x350
Feb  5 08:10:52 Fruity kernel: [<ffffffff8141dccb>] ? __netif_receive_skb+0x39b/0x6b0
Feb  5 08:10:52 Fruity kernel: [<ffffffff810db997>] ? cpu_quiet_msk+0x77/0x130
Feb  5 08:10:52 Fruity kernel: [<ffffffff8141e07a>] ? process_backlog+0x9a/0x100
Feb  5 08:10:52 Fruity kernel: [<ffffffff81422533>] ? net_rx_action+0x103/0x2f0
Feb  5 08:10:52 Fruity kernel: [<ffffffff8106f6e1>] ? __do_softirq+0xc1/0x1d0
Feb  5 08:10:52 Fruity kernel: [<ffffffff8100c2cc>] ? call_softirq+0x1c/0x30
Feb  5 08:10:52 Fruity kernel: [<ffffffff8100c2cc>] ? call_softirq+0x1c/0x30
Feb  5 08:10:52 Fruity kernel: <EOI>  [<ffffffff8100df05>] ? do_softirq+0x65/0xa0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81070028>] ? local_bh_enable_ip+0x98/0xa0
Feb  5 08:10:52 Fruity kernel: [<ffffffff814dd92b>] ? _spin_unlock_bh+0x1b/0x20
Feb  5 08:10:52 Fruity kernel: [<ffffffff8140f46e>] ? release_sock+0xce/0xe0
Feb  5 08:10:52 Fruity kernel: [<ffffffff81483953>] ? inet_stream_connect+0x183/0x2c0
Feb  5 08:10:52 Fruity kernel: [<ffffffff8108e180>] ? autoremove_wake_function+0x0/0x40
Feb  5 08:10:52 Fruity kernel: [<ffffffff8140d007>] ? sys_connect+0xd7/0xf0
Feb  5 08:10:52 Fruity kernel: [<ffffffff8145f652>] ? compat_tcp_setsockopt+0x22/0x30
Feb  5 08:10:52 Fruity kernel: [<ffffffff8140eb9c>] ? compat_sock_common_setsockopt+0x1c/0x30
Feb  5 08:10:52 Fruity kernel: [<ffffffff81437d05>] ? compat_sys_setsockopt+0x85/0x220
Feb  5 08:10:52 Fruity kernel: [<ffffffff81184828>] ? sys_fcntl+0x118/0x530
Feb  5 08:10:52 Fruity kernel: [<ffffffff8143805e>] ? compat_sys_socketcall+0x1be/0x200
Feb  5 08:10:52 Fruity kernel: [<ffffffff810478b0>] ? sysenter_dispatch+0x7/0x2e
Feb  5 08:10:52 Fruity kernel: Mem-Info:
Feb  5 08:10:52 Fruity kernel: Node 0 DMA per-cpu:
Feb  5 08:10:52 Fruity kernel: CPU    0: hi:    0, btch:   1 usd:   0
Feb  5 08:10:52 Fruity kernel: CPU    1: hi:    0, btch:   1 usd:   0
Feb  5 08:10:52 Fruity kernel: CPU    2: hi:    0, btch:   1 usd:   0
Feb  5 08:10:52 Fruity kernel: CPU    3: hi:    0, btch:   1 usd:   0
Feb  5 08:10:52 Fruity kernel: CPU    4: hi:    0, btch:   1 usd:   0
Feb  5 08:10:52 Fruity kernel: CPU    5: hi:    0, btch:   1 usd:   0
Feb  5 08:10:52 Fruity kernel: Node 0 DMA32 per-cpu:
Feb  5 08:10:52 Fruity kernel: CPU    0: hi:  186, btch:  31 usd: 167
Feb  5 08:10:52 Fruity kernel: CPU    1: hi:  186, btch:  31 usd:  44
Feb  5 08:10:52 Fruity kernel: CPU    2: hi:  186, btch:  31 usd:  59
Feb  5 08:10:52 Fruity kernel: CPU    3: hi:  186, btch:  31 usd:  46
Feb  5 08:10:52 Fruity kernel: CPU    4: hi:  186, btch:  31 usd: 157
Feb  5 08:10:52 Fruity kernel: CPU    5: hi:  186, btch:  31 usd:  45
Feb  5 08:10:52 Fruity kernel: Node 0 Normal per-cpu:
Feb  5 08:10:52 Fruity kernel: CPU    0: hi:  186, btch:  31 usd: 182
Feb  5 08:10:52 Fruity kernel: CPU    1: hi:  186, btch:  31 usd:  44
Feb  5 08:10:52 Fruity kernel: CPU    2: hi:  186, btch:  31 usd:  15
Feb  5 08:10:52 Fruity kernel: CPU    3: hi:  186, btch:  31 usd:  88
Feb  5 08:10:52 Fruity kernel: CPU    4: hi:  186, btch:  31 usd: 181
Feb  5 08:10:52 Fruity kernel: CPU    5: hi:  186, btch:  31 usd:  33
Feb  5 08:10:52 Fruity kernel: active_anon:79381 inactive_anon:21406 isolated_anon:0
Feb  5 08:10:52 Fruity kernel: active_file:395766 inactive_file:1432708 isolated_file:0
Feb  5 08:10:52 Fruity kernel: unevictable:0 dirty:297 writeback:0 unstable:0
Feb  5 08:10:52 Fruity kernel: free:31126 slab_reclaimable:25909 slab_unreclaimable:44714
Feb  5 08:10:52 Fruity kernel: mapped:3908 shmem:103 pagetables:4196 bounce:0
Feb  5 08:10:52 Fruity kernel: Node 0 DMA free:15680kB min:124kB low:152kB high:184kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:15284kB mlocked:0kB dirty:0kB writeback:0kB mapped:0kB shmem:0kB slab_reclaimable:0kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:0kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? yes
Feb  5 08:10:52 Fruity kernel: lowmem_reserve[]: 0 3000 8050 8050
Feb  5 08:10:52 Fruity kernel: Node 0 DMA32 free:56332kB min:25140kB low:31424kB high:37708kB active_anon:36800kB inactive_anon:33152kB active_file:631228kB inactive_file:2126792kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:3072160kB mlocked:0kB dirty:360kB writeback:0kB mapped:4500kB shmem:4kB slab_reclaimable:42108kB slab_unreclaimable:4760kB kernel_stack:256kB pagetables:1228kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no
Feb  5 08:10:52 Fruity kernel: lowmem_reserve[]: 0 0 5050 5050
Feb  5 08:10:52 Fruity kernel: Node 0 Normal free:52492kB min:42316kB low:52892kB high:63472kB active_anon:280724kB inactive_anon:52472kB active_file:951836kB inactive_file:3603784kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:5171200kB mlocked:0kB dirty:828kB writeback:0kB mapped:11132kB shmem:408kB slab_reclaimable:61528kB slab_unreclaimable:174096kB kernel_stack:3112kB pagetables:15556kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no
Feb  5 08:10:52 Fruity kernel: lowmem_reserve[]: 0 0 0 0
Feb  5 08:10:52 Fruity kernel: Node 0 DMA: 4*4kB 2*8kB 2*16kB 0*32kB 2*64kB 1*128kB 0*256kB 0*512kB 1*1024kB 1*2048kB 3*4096kB = 15680kB
Feb  5 08:10:52 Fruity kernel: Node 0 DMA32: 12892*4kB 79*8kB 30*16kB 10*32kB 4*64kB 19*128kB 3*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 56456kB
Feb  5 08:10:52 Fruity kernel: Node 0 Normal: 12558*4kB 35*8kB 1*16kB 1*32kB 4*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB 0*4096kB = 52864kB
Feb  5 08:10:52 Fruity kernel: 1834295 total pagecache pages
Feb  5 08:10:52 Fruity kernel: 5823 pages in swap cache
Feb  5 08:10:52 Fruity kernel: Swap cache stats: add 112073, delete 106250, find 283106960/283124994
Feb  5 08:10:52 Fruity kernel: Free swap  = 8352448kB
Feb  5 08:10:52 Fruity kernel: Total swap = 8388600kB
Feb  5 08:10:52 Fruity kernel: 2097136 pages RAM
Feb  5 08:10:52 Fruity kernel: 48740 pages reserved
Feb  5 08:10:52 Fruity kernel: 73879 pages shared
Feb  5 08:10:52 Fruity kernel: 1940523 pages non-shared

Edit: Dies geschieht immer noch, selbst mit einigen der unten vorgeschlagenen Änderungen. Die aktuelle Kurve sieht folgendermaßen aus:

Feb 29 04:45:33 Fruity kernel: swapper: page allocation failure. order:1, mode:0x20
Feb 29 04:45:33 Fruity kernel: Pid: 0, comm: swapper Not tainted 2.6.32-131.17.1.el6.x86_64 #1
Feb 29 04:45:33 Fruity kernel: Call Trace:
Feb 29 04:45:33 Fruity kernel: <IRQ>  [<ffffffff8112016e>] ? __alloc_pages_nodemask+0x71e/0x8b0
Feb 29 04:45:33 Fruity kernel: [<ffffffff81159a52>] ? kmem_getpages+0x62/0x170
Feb 29 04:45:33 Fruity kernel: [<ffffffff8115a66a>] ? fallback_alloc+0x1ba/0x270
Feb 29 04:45:33 Fruity kernel: [<ffffffff8115a0bf>] ? cache_grow+0x2cf/0x320
Feb 29 04:45:33 Fruity kernel: [<ffffffff8115a3e9>] ? ____cache_alloc_node+0x99/0x160
Feb 29 04:45:33 Fruity kernel: [<ffffffff8115b1ab>] ? kmem_cache_alloc+0x11b/0x190
Feb 29 04:45:33 Fruity kernel: [<ffffffff81411ba8>] ? sk_prot_alloc+0x48/0x1a0
Feb 29 04:45:33 Fruity kernel: [<ffffffff81411e12>] ? sk_clone+0x22/0x2c0
Feb 29 04:45:33 Fruity kernel: [<ffffffff8145caf6>] ? inet_csk_clone+0x16/0xd0
Feb 29 04:45:33 Fruity kernel: [<ffffffff81475be3>] ? tcp_create_openreq_child+0x23/0x450
Feb 29 04:45:33 Fruity kernel: [<ffffffff814735cd>] ? tcp_v4_syn_recv_sock+0x4d/0x2a0
Feb 29 04:45:33 Fruity kernel: [<ffffffff814759a1>] ? tcp_check_req+0x201/0x420
Feb 29 04:45:33 Fruity kernel: [<ffffffff8146b4b6>] ? tcp_rcv_state_process+0x116/0xa30
Feb 29 04:45:33 Fruity kernel: [<ffffffff81472feb>] ? tcp_v4_do_rcv+0x35b/0x430
Feb 29 04:45:33 Fruity kernel: [<ffffffff81413a1b>] ? consume_skb+0x3b/0x80
Feb 29 04:45:33 Fruity kernel: [<ffffffff81474760>] ? tcp_v4_rcv+0x4e0/0x860
Feb 29 04:45:33 Fruity kernel: [<ffffffff8145247d>] ? ip_local_deliver_finish+0xdd/0x2d0
Feb 29 04:45:33 Fruity kernel: [<ffffffff81452708>] ? ip_local_deliver+0x98/0xa0
Feb 29 04:45:33 Fruity kernel: [<ffffffff81451bcd>] ? ip_rcv_finish+0x12d/0x440
Feb 29 04:45:33 Fruity kernel: [<ffffffff81452155>] ? ip_rcv+0x275/0x350
Feb 29 04:45:33 Fruity kernel: [<ffffffff8141dccb>] ? __netif_receive_skb+0x39b/0x6b0
Feb 29 04:45:33 Fruity kernel: [<ffffffff810a41a4>] ? __smp_call_function_single+0x64/0xe0
Feb 29 04:45:33 Fruity kernel: [<ffffffff8141ffd8>] ? netif_receive_skb+0x58/0x60
Feb 29 04:45:33 Fruity kernel: [<ffffffffa0131853>] ? vmxnet3_poll+0x403/0x9f0 [vmxnet3]
Feb 29 04:45:33 Fruity kernel: [<ffffffffa0036c40>] ? pvscsi_process_completion_ring+0xe0/0x350 [vmw_pvscsi]
Feb 29 04:45:33 Fruity kernel: [<ffffffff81422533>] ? net_rx_action+0x103/0x2f0
Feb 29 04:45:33 Fruity kernel: [<ffffffff8106f6e1>] ? __do_softirq+0xc1/0x1d0
Feb 29 04:45:33 Fruity kernel: [<ffffffff810d6930>] ? handle_IRQ_event+0x60/0x170
Feb 29 04:45:33 Fruity kernel: [<ffffffff8100c2cc>] ? call_softirq+0x1c/0x30
Feb 29 04:45:33 Fruity kernel: [<ffffffff8100df05>] ? do_softirq+0x65/0xa0
Feb 29 04:45:33 Fruity kernel: [<ffffffff8106f4c5>] ? irq_exit+0x85/0x90
Feb 29 04:45:33 Fruity kernel: [<ffffffff814e3195>] ? do_IRQ+0x75/0xf0
Feb 29 04:45:33 Fruity kernel: [<ffffffff8100bad3>] ? ret_from_intr+0x0/0x11
Feb 29 04:45:33 Fruity kernel: <EOI>  [<ffffffff8103628b>] ? native_safe_halt+0xb/0x10
Feb 29 04:45:33 Fruity kernel: [<ffffffff810142ed>] ? default_idle+0x4d/0xb0
Feb 29 04:45:33 Fruity kernel: [<ffffffff81009e86>] ? cpu_idle+0xb6/0x110
Feb 29 04:45:33 Fruity kernel: [<ffffffff814c33da>] ? rest_init+0x7a/0x80
Feb 29 04:45:33 Fruity kernel: [<ffffffff81c1df28>] ? start_kernel+0x41d/0x429
Feb 29 04:45:33 Fruity kernel: [<ffffffff81c1d33a>] ? x86_64_start_reservations+0x125/0x129
Feb 29 04:45:33 Fruity kernel: [<ffffffff81c1d438>] ? x86_64_start_kernel+0xfa/0x109
Feb 29 04:45:33 Fruity kernel: Mem-Info:
Feb 29 04:45:33 Fruity kernel: Node 0 DMA per-cpu:
Feb 29 04:45:33 Fruity kernel: CPU    0: hi:    0, btch:   1 usd:   0
Feb 29 04:45:33 Fruity kernel: CPU    1: hi:    0, btch:   1 usd:   0
Feb 29 04:45:33 Fruity kernel: CPU    2: hi:    0, btch:   1 usd:   0
Feb 29 04:45:33 Fruity kernel: CPU    3: hi:    0, btch:   1 usd:   0
Feb 29 04:45:33 Fruity kernel: CPU    4: hi:    0, btch:   1 usd:   0
Feb 29 04:45:33 Fruity kernel: CPU    5: hi:    0, btch:   1 usd:   0
Feb 29 04:45:33 Fruity kernel: Node 0 DMA32 per-cpu:
Feb 29 04:45:33 Fruity kernel: CPU    0: hi:  186, btch:  31 usd:  46
Feb 29 04:45:33 Fruity kernel: CPU    1: hi:  186, btch:  31 usd:   1
Feb 29 04:45:33 Fruity kernel: CPU    2: hi:  186, btch:  31 usd:  23
Feb 29 04:45:33 Fruity kernel: CPU    3: hi:  186, btch:  31 usd:  10
Feb 29 04:45:33 Fruity kernel: CPU    4: hi:  186, btch:  31 usd:  38
Feb 29 04:45:33 Fruity kernel: CPU    5: hi:  186, btch:  31 usd:   2
Feb 29 04:45:33 Fruity kernel: Node 0 Normal per-cpu:
Feb 29 04:45:33 Fruity kernel: CPU    0: hi:  186, btch:  31 usd:  65
Feb 29 04:45:33 Fruity kernel: CPU    1: hi:  186, btch:  31 usd:   0
Feb 29 04:45:33 Fruity kernel: CPU    2: hi:  186, btch:  31 usd:  14
Feb 29 04:45:33 Fruity kernel: CPU    3: hi:  186, btch:  31 usd:   2
Feb 29 04:45:33 Fruity kernel: CPU    4: hi:  186, btch:  31 usd:  29
Feb 29 04:45:33 Fruity kernel: CPU    5: hi:  186, btch:  31 usd:  50
Feb 29 04:45:33 Fruity kernel: active_anon:118532 inactive_anon:29343 isolated_anon:0
Feb 29 04:45:33 Fruity kernel: active_file:870242 inactive_file:899801 isolated_file:0
Feb 29 04:45:33 Fruity kernel: unevictable:0 dirty:5135 writeback:0 unstable:0
Feb 29 04:45:33 Fruity kernel: free:33179 slab_reclaimable:34315 slab_unreclaimable:45350
Feb 29 04:45:33 Fruity kernel: mapped:3464 shmem:133 pagetables:4997 bounce:0
Feb 29 04:45:33 Fruity kernel: Node 0 DMA free:15680kB min:124kB low:152kB high:184kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:15284kB mlocked:0kB dirty:0kB writeback:0kB mapped:0kB shmem:0kB slab_reclaimable:0kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:0kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no
Feb 29 04:45:33 Fruity kernel: lowmem_reserve[]: 0 3000 8050 8050
Feb 29 04:45:33 Fruity kernel: Node 0 DMA32 free:64200kB min:25140kB low:31424kB high:37708kB active_anon:59816kB inactive_anon:47980kB active_file:1319196kB inactive_file:1374832kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:3072160kB mlocked:0kB dirty:7680kB writeback:0kB mapped:3004kB shmem:40kB slab_reclaimable:62060kB slab_unreclaimable:5368kB kernel_stack:160kB pagetables:900kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no
Feb 29 04:45:33 Fruity kernel: lowmem_reserve[]: 0 0 5050 5050
Feb 29 04:45:33 Fruity kernel: Node 0 Normal free:52836kB min:42316kB low:52892kB high:63472kB active_anon:414312kB inactive_anon:69392kB active_file:2161772kB inactive_file:2224372kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:5171200kB mlocked:0kB dirty:12860kB writeback:0kB mapped:10852kB shmem:492kB slab_reclaimable:75200kB slab_unreclaimable:176032kB kernel_stack:3384kB pagetables:19088kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no
Feb 29 04:45:33 Fruity kernel: lowmem_reserve[]: 0 0 0 0
Feb 29 04:45:33 Fruity kernel: Node 0 DMA: 4*4kB 2*8kB 2*16kB 0*32kB 2*64kB 1*128kB 0*256kB 0*512kB 1*1024kB 1*2048kB 3*4096kB = 15680kB
Feb 29 04:45:33 Fruity kernel: Node 0 DMA32: 15988*4kB 0*8kB 0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 63952kB
Feb 29 04:45:33 Fruity kernel: Node 0 Normal: 13209*4kB 0*8kB 0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 52836kB
Feb 29 04:45:33 Fruity kernel: 1776603 total pagecache pages
Feb 29 04:45:33 Fruity kernel: 6398 pages in swap cache
Feb 29 04:45:33 Fruity kernel: Swap cache stats: add 163231, delete 156833, find 403959091/403986630
Feb 29 04:45:33 Fruity kernel: Free swap  = 8339552kB
Feb 29 04:45:33 Fruity kernel: Total swap = 8388600kB
Feb 29 04:45:33 Fruity kernel: 2097136 pages RAM
Feb 29 04:45:33 Fruity kernel: 48740 pages reserved
Feb 29 04:45:33 Fruity kernel: 198220 pages shared
Feb 29 04:45:33 Fruity kernel: 1833933 pages non-shared

6
2018-02-10 15:53


Ursprung


Ist das ein 32-Bit-System? Diese Seite http://www.cyberciti.biz/faq/linux-page-allocation-failure-erro/ sagt, es ist ein Speicherfragmentierungsproblem. Es scheint mir, dass es nicht auf x86_64 passieren sollte. - AndreasM
Dies ist ein virtueller 64-Bit-Server mit 8 GB RAM. - ewwhite
Meldet der Gastgeber irgendwelche Probleme? - AndreasM
Es wurden keine ESXi-Hostfehler gemeldet. Dies ist vollständig in der VM enthalten. - ewwhite
Weißt du, was die App ABC macht? Scheint, setsocketopt aufzurufen, vielleicht mit einem verrückten Pufferwert. - AndreasM


Antworten:


Denken Sie hier laut nach, aber haben Sie in Erwägung gezogen, den Wert vm.min_free_kbytes mit sysctl zu erhöhen?

so etwas wie:

sysctl vm.min_free_kbytes=16384 

(ps - nicht 100% sicher, was es auf Centos zu sein scheint, eher unter / proc / sys / vm / min_free_kbytes)


3
2018-02-14 12:52



[root @ Fruchtig ~] # cat / proc / sys / vm / min_free_kbytes == 67584 - ewwhite
66MB klingt mehr als vernünftig, aber wenn starke Fragmentierung auftritt, kann dies immer noch zu niedrig sein. Da dies in einer VM-Umgebung ist, haben Sie den Host und die entsprechenden vmtools aktualisiert. Möglicherweise möchten Sie die Speichernutzung nicht nur in der Anwendung, sondern auch in anderen Prozessen überwachen. Last but not least würde ich den Kernel verbessern - Cold T
Dies ist die Standardeinstellung in CentOS 6. - ewwhite
Wenn ich den Wert auf mindestens 256MB hochsetze, habe ich keine Ahnung, was das Programm ABC macht, aber wenn es schnell viel Speicherplatz benötigt / benötigt, würde es sicherlich die Seitenzuordnungsfehler verursachen. Der Standardwert entspricht dem Gesamtspeicher des Geräts. Sie könnten sich auch wundern, was dieses min-free-kbytes mit Seitenzuweisungen zu tun hat, gut in einfachen Worten verwendet es diesen Wert, um die minimale Anzahl von Speicherseiten zu berechnen - Cold T
Programm ABC benötigt ~ 20MB pro Benutzerinstanz. Nehmen wir an, das System maximiert bei 80 Benutzern. Die VMWare-Tools sind aktuell und der Kernel ist für die Überarbeitung von CentOS auf dem neuesten Stand. Obwohl ich auf CentOS 6.2 aktualisieren sollte. ABC ist kein RAM-Schwein überhaupt. Der meiste verwendete Speicher ist Dateisystemcache. - ewwhite


Ich habe viele davon gesehen ... vor allem auf meinem Spiegelserver mit Apache. Auf diesem Server half die Änderung des SLAB-Allokators für SLUB, das Problem insgesamt zu mildern.

Auf einer anderen Maschine mit einer großen MTU-Schnittstelle bekomme ich immer noch Zuteilungsfehler in einem ähnlichen Pfad, aber dieses Mal Auftrag 5. Habe noch keine Lösung für diesen gefunden.

Eine andere Sache, die teilweise hilft oder eher hilft, die Frequenz ein wenig zu reduzieren, ist häufige Speicherverdichtung (echo 1 > /proc/sys/vm/compact_memory laufe jede Minute von cron).

Eine andere Sache, die es wert ist, zu betrachten, ist, wie Ihre Anwendung mit Speicher arbeitet - dh. wie teilt und befreit es. Wenn häufige Zu- und Abmeldungen vorgenommen werden, kann es sich lohnen, eine Art von Speicherpool zu verwenden.

Das letzte, was einen Versuch wert ist, ist die Aktivierung oder Deaktivierung (transparenter) riesiger Seiten.


3
2018-02-18 10:08



Gute Vorschläge. Ich werde es versuchen. - ewwhite


Das Problem waren veraltete VMware-Gasttreiber (vmware-tools) und ein neueres Betriebssystem unter Last. Dies wird überarbeitet, sobald ESXi aktualisiert wird. Out-of-the-Box-Point-Releases von VMWare zeigen dieses Problem an. Aktualisierte Versionen sind nicht.

Na sicher, Es stellt sich die Frage, wie Sie Ihre VMware-Installation sauber aktualisieren können...


1
2017-08-25 16:31