Notes
main
main
  • Introduction
  • linuxKernel
    • tips
    • make_help
    • old linux
      • compile_linux0.11
      • TestEnvironment
      • load_setup
      • get_hard_data
    • list
    • plist
    • fifo
    • idr
    • xarray
    • rbtree
    • maple_tree
    • syscall
    • bitmap
    • page
    • page_flags
    • page_size
    • page mapcount
    • page refcount
    • folio
    • slub
      • proc_slabinfo
      • slub_theory
      • kmalloc_kfree
      • kmem_cache
      • slab_alloc
      • slab_free
      • proc_meminfo_SReclaimable_SReclaimable
    • vmalloc
    • brk
    • mmap
    • mremap
    • mprotect
    • madvise
    • read
    • write
    • shmem
    • huge_page
    • page_fault
    • rmap
    • lru
    • multi-gen-LRU
    • page_reclaim
    • page_cache
    • page_table
    • rcu
    • kvm
    • aarch64_boot
    • tracing_system
    • cache_coherence_and_memory_consistency
    • cpu_speculates
    • mmap_lock
    • per-vma_lock
    • cgroup
    • symbol
    • campact
    • page_ext
    • mempool
    • kernelstack
    • filesystem
    • io_stack
    • workingset
    • ioremap
    • sched_period
  • linuxDebug
    • openocd_openjtag
    • i2c_tools
    • objdump
    • addr2line
    • gdb_useage
    • debug_linux_kernel_via_gdb
    • debug_linux_module_via_gdb
    • early_boot
    • sequentially_execute
    • dynamic_debug
    • research_linuxKernel_by_patch
    • tracefs
    • ebpf
    • bpftrace
    • perf
    • flame_graph
    • crash
    • ASAN_HWASAN_MTE_check_mem_bug
    • page_owner
    • vmtouch
    • fio
    • benchmark
  • linuxSystem
    • common
      • system_version
      • procfs
      • proc_sys_vm
      • cmd_ps
      • makefile
      • file_descriptor
      • psi
      • ulimit
      • top
      • delay_accounting
    • ubuntu
      • custom_kernel
      • get_cmd_src
      • record_ssh_info
      • log
      • run_custom_script
      • repo
      • cockpit
      • nfs
      • tftp
      • misc
    • fedora
      • system_upgrade
      • custom_kernel
      • lvextend
      • yt-dlp
      • jellyfin
  • linuxDriver
    • i2c_peripherals_driver
    • spi_peripherals_driver
    • gpio_subsystem
    • IRQ_driver
    • blockIO_unblockIO_async
    • linux_own_driver
    • misc_device
    • input_device
    • timer
    • atomic_spinlock_semaphore_mutex
    • lcd
    • touch_screen
    • debugfs
    • v4l2
    • mmap
  • hardware
    • paging_mmu_pt
    • iommu
  • process_thread_scheduler
    • scheduler01
    • scheduler02
    • scheduler03
    • scheduler04
    • scheduler05
    • scheduler06
  • memory_management
    • mm1
    • mm2
    • mm3
    • mm4
    • mm5
  • input_output_filesystem
    • io_fs_01
    • io_fs_02
    • io_fs_03
    • io_fs_04
  • lock_and_lockup_detector
    • general_lock
    • hung_task
    • softLockup_hardLockup
    • crash_experiment
  • MIT_6.S081
    • 6.S081_Operating_System_Engineering
    • Schedule.md
    • Class
      • Overview
      • Administrivia
    • Labs
      • Tools
      • Guidance
      • startup
      • syscall
      • page_table
      • Calling_Convention
      • traps
    • xv6
      • xv6
    • References.md
  • qemu
    • qemu_buildroot
    • qemu_busybox.md
    • Serial.md
    • demo_mini2440
      • 0_compilation_error_summary
      • 1_compilation_steps
      • 2_operation_mode
      • 3_transplant_tools_libraries
      • 4_tools_use
      • reference_website
  • tools
    • getKernelSourceCodeList
    • nat
    • shell
    • translating
    • YouCompleteMe
    • cscope
    • global
    • vscode
    • vim
    • binary
    • markdown
    • draw
    • git
    • tig
    • tmux
    • mail_client
    • download_patchset_from_LKML
    • minicom
    • clash
  • other
    • interview
    • interview_c_base
    • know_dontknow
    • Stop-Ask-Questions-The-Stupid-Ways
    • How-To-Ask-Questions-The-Smart-Way
    • docker
    • buildroot
    • rv32_to_rv64
Powered by GitBook
On this page
  • 简述
  • 场景分析
  • 哪些函数支持将 folio 移动到对应的 LRU list 中?
  • 什么场景下将所有 fbatch 包含的所有 folio 都添加到对应的 LRU list?
  • 什么场景下移动 folio 到另一个 LRU list?
  • 什么场景下自动将 folio 移动到 LRU inactive list?
  • 什么场景下自动将 folio 移动到 LRU active list?
  • 详细解析
  • 杂项

Was this helpful?

  1. linuxKernel

lru

简述

LRU,全称 Least Recently Used,最近最少使用

具体实现需要以下两个条件:

struct page {
    unsigned long flags;   // 存储 `enum lru_list` 属性
    struct list_head lru;  // 链接到 inactive/active 链表
};

将最近使用过的页链接到 active 链表中,最近没有使用的页链接到 inactive 链表

因为存在 文件页/匿名页,需要与 inactive/active 进行两两组合,所以 至少有四种 LRU 链表,如下:

enum lru_list {
    LRU_INACTIVE_ANON = LRU_BASE,
    LRU_ACTIVE_ANON = LRU_BASE + LRU_ACTIVE,
    LRU_INACTIVE_FILE = LRU_BASE + LRU_FILE,
    LRU_ACTIVE_FILE = LRU_BASE + LRU_FILE + LRU_ACTIVE,
    LRU_UNEVICTABLE,
    NR_LRU_LISTS
};

struct lruvec {
    struct list_head		lists[NR_LRU_LISTS];
    ...
};

最后,Page Reclaim 子系统依次从 LRU 链表中获得页,直接进行一系列的回收操作

场景分析

哪些函数支持将 folio 移动到对应的 LRU list 中?

                                    move_fn
folio_add_lru(folio)                lru_add_fn()
folio_activate(folio)               folio_activate_fn()
folio_deactivate(folio)             lru_deactivate_fn()
deactivate_file_folio(folio)        lru_deactivate_file_fn()
folio_mark_lazyfree(folio)          lru_lazyfree_fn()
        |
        v
    folio_batch_add_and_move(fbatch, folio, move_fn)
                                                |
        lruvec_add_folio()  <-------------------+

将 folio 先暂时放在 fbatch 中,当 fbatch 满时,通过 move_fn 调用 lruvec_add_folio(), 将 fbatch 包含的所有 folio 都添加到对应的 LRU list。

什么场景下将所有 fbatch 包含的所有 folio 都添加到对应的 LRU list?

lru_add_drain()
    lru_add_drain_cpu()
        folio_batch_move_lru(fbatch, move_fn)   move_fn
                                                lru_add_fn()
                                                folio_activate_fn()
                                                lru_deactivate_fn()
                                                lru_deactivate_file_fn()
                                                lru_lazyfree_fn()
                                                    |
            lruvec_add_folio()  <-------------------+

调用 lru_add_drain(),通过 move_fn 调用 lruvec_add_folio(),将之前放在 fbatch 中的所有 folio 都添加到对应的 LRU list。

什么场景下调用 lru_add_drain()?

  • memory reclaim, e.g. shrink_inactive_list(), shrink_active_list()

  • memory compact, e.g. compact_zone()

  • pagefault, e.g. do_wp_page(), do_swap_page()

  • syscall, e.g. madvise(), mlock()

  • task exit, e.g. exit_mmap()

什么场景下移动 folio 到另一个 LRU list?

或者说 什么场景下将 folio 先暂时放在 fbatch 中?

  • folio_add_lru(folio)

do_pte_missing()
    do_anonymous_page()
    do_fault()
        do_read_fault()   --+
        do_cow_fault()      +--> finish_fault() -> set_pte_range() -> folio_add_lru_vma()
        do_shared_fault() --+
do_swap_page()
    folio_add_lru_vma()
do_wp_page()
    wp_page_copy()
        folio_add_lru_vma()

folio_add_lru_vma()
    folio_add_lru()

/*
 * inactive,unreferenced    ->  inactive,referenced
 * inactive,referenced      ->  active,unreferenced
 * active,unreferenced      ->  active,referenced
 */
folio_mark_accessed(folio)
    folio_activate(folio)
        folio_set_active(folio)
        lruvec_add_folio()

在 pagefault 中调用 folio_add_lru() 将 folio 先暂时放在 lru_add fbatch 中。 这是提供一个机会,因为后面可能会使用 folio_mark_accessed() 将 folio 移动到 LRU active list 中。否则,默认将 folio 移动到 LRU inactive list 中。

除了 pagefault 外,正常情况下,需要提前使用 folio_set_active()/folio_clear_active() 设置 folio 的属性,这样在调用 folio_add_lru() 时,才将 folio 移动到对应的 LRU active/inactive list 中。

  • folio_activate(folio)

folio_activate(folio)
    folio_set_active(folio)
    lruvec_add_folio()

如果 folio 在 LRU inactive list, 将 folio 移动在 LRU active list 中。 e.g read()

上面场景都是用户空间手动调用 read() 将某个 folio 移动到 LRU active list 中

  • folio_deactivate(folio)

folio_deactivate(folio)
    folio_clear_active(folio)
    folio_clear_referenced(folio)
    lruvec_add_folio()

如果 folio 在 LRU active list, 将 folio 移动在 LRU inactive list 中。 e.g. madvise(MADV_COLD)

  • deactivate_file_folio(folio)

deactivate_file_folio(folio)
    folio_clear_active(folio)
    folio_clear_referenced(folio)
    lruvec_add_folio()

如果 file folio 在 LRU active list, 将 file folio 移动在 LRU inactive list 中。 e.g. madvise(MADV_WILLNEED), fadvise64()

  • folio_mark_lazyfree(folio)

folio_mark_lazyfree(folio)
    folio_clear_active(folio)
    folio_clear_referenced(folio)
    lruvec_add_folio()

如果 anon folio 在 LRU active list 并且有 swapbacked 标志, 将 anon folio 移动在 LRU inactive list 中。 e.g. madvise(MADV_FREE)

上面场景都是用户空间手动调用 madvise() 将某个 folio 移动到 LRU inactive list 中

什么场景下自动将 folio 移动到 LRU inactive list?

shrink_active_list()
    isolate_lru_folios()
    folio_clear_active(folio)
    list_add(&folio->lru, &l_inactive)
    move_folios_to_lru(lruvec, &l_inactive)
        lruvec_add_folio()

kswadp 线程能够调用 shrink_active_list(),自动将 folios 从 LRU active list 移动 到 LRU inactive list 中。

什么场景下自动将 folio 移动到 LRU active list?

workingset_refault(folio)
    workingset_test_recent()
    folio_set_active(folio)
folio_add_lru()
    lruvec_add_folio()

当(file or anon backing-device)folio 被回收后,出现 refault 现象,调用 workingset_test_recent() 判断 folio 是否是最近被驱逐?如果是最近被驱逐, 将 folio 设置成 active 属性,这样后面紧接着调用 lruvec_add_folio() 能够将 folio 移动到 LRU active list 中

shrink_folio_list()
    folio_check_references(folio)
        folio_referenced(folio)
    folio_set_active(folio)
move_folios_to_lru()
    lruvec_add_folio()

正在进行回收时,通过 folio_referenced() 判断 folio 最近是否被访问过?如果被访问过, 将 folio 设置成 active 属性,这样后面紧接着调用 lruvec_add_folio() 能够将 folio 移动到 LRU active list 中

详细解析

lruvec_add_folio()   ## add_page_to_lru_list()
    lru_gen_add_folio()
    folio_lru_list()
    list_add()

如果支持 MGLRU,直接调用 lru_gen_add_folio()

否则,先调用 folio_lru_list() 获得 folio 是属于哪一个 enum lru_list, 然后再调用 list_add() 将 folio 加入到对应的 LRU list 中

lruvec_del_folio()   ## del_page_from_lru_list()
    lru_gen_del_folio()
    folio_lru_list()
    list_del()

如果支持 MGLRU,直接调用 lru_gen_del_folio()

否则,先调用 folio_lru_list() 获得 folio 是属于哪一个 enum lru_list, 然后再调用 list_del() 将 folio 从对应的 LRU list 中删除

杂项

从 v5.18 07ca76067308 mm/munlock: maintain page->mlock_count while unevictable 提交后,LRU_UNEVICTABLE list 变成一个虚假的链表,即 UNEVICTABLE page->lru 不用链接到 LRU_UNEVICTABLE list,只需要统计保存 UNEVICTABLE page 个数。 这样原本的 page->lru 没有使用,所以将 page->lru.prev 复用为 page->mlock_count。

PreviousrmapNextmulti-gen-LRU

Last updated 1 year ago

Was this helpful?