Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
Help us understand the problem. What is going on with this article?

俺のlsが遅すぎる その2

More than 1 year has passed since last update.

なぜ?

オレオレなlsを書いたのだがなぜか遅い。
lsなんて興味ないんだけど、stat()しているだけなのに遅いのは生理的になんかいやだ。

前回はgetpwuid()が犯人とすぐわかり改善できたのだが、機能拡張をしたらまた遅くなった。なぜ?

コード

とりあえずファイル名とタイムスタンプを表示させただけなのだが...
変更箇所は1つしかないので、犯人はlocaltime()に違いない。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/stat.h>
#include <dirent.h>
#include <time.h>

int main(int argc, char** argv)
{
    char fpath[PATH_MAX];
    DIR* dir;
    struct dirent* dp;
    struct stat st;
    char *dpath;
    char timestr[25];

    dpath = (argc != 2) ? "." : argv[1];

    dir = opendir(dpath);
    while ((dp = readdir(dir)) != NULL) {
        memset(fpath, '\0', sizeof(fpath));
        sprintf(fpath, "%s/%s", dpath, dp->d_name);
        if (stat(fpath, &st) != -1) {
            struct tm* t = localtime( &st.st_mtime );
            strftime(timestr, sizeof(timestr), "%Y-%m-%dT%H:%M:%S", t);
            fprintf(stdout, "{ filename = %s, timestamp = %s }\n", fpath, timestr);
        }
    }
    closedir(dir);
    exit(EXIT_SUCCESS);
}

調査

例によってltraceで関数の呼び出し性能を確認してみる。
localtime()が遅い。strftime()も遅いがここでは一旦無視しよう。

$ ltrace -c ./minls too_many_files.d/ > /dev/null
% time     seconds  usecs/call     calls      function
------ ----------- ----------- --------- --------------------
 53.74    5.512542     5512542         1 __libc_start_main
  7.78    0.797738          79     10002 localtime
  7.25    0.743969          74     10002 __xstat
  6.36    0.652299          65     10002 strftime
  6.28    0.644409          64     10002 fprintf
  6.25    0.641071          64     10002 sprintf
  6.17    0.632683          63     10003 readdir
  6.17    0.632531          63     10002 memset
  0.00    0.000173         173         1 opendir
  0.00    0.000144         144         1 exit
  0.00    0.000072          72         1 closedir
  0.00    0.000071          71         1 exit_group
------ ----------- ----------- --------- --------------------
100.00   10.257702                 70020 total

なんとなくデジャブ感が出てきた。
余計なstat()をしている気がするのでstraceで確認してみる。
ああー、/etc/localtime を毎回みているのかよ。

$ strace -f -e stat ./minls . 1> /dev/null
stat("./.", {st_mode=S_IFDIR|0775, st_size=118, ...}) = 0
stat("./..", {st_mode=S_IFDIR|0700, st_size=4096, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
stat("./test.c", {st_mode=S_IFREG|0664, st_size=816, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
stat("./too_many_files.d", {st_mode=S_IFDIR|0775, st_size=315392, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
stat("./test-1.c", {st_mode=S_IFREG|0664, st_size=712, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
stat("./minls1", {st_mode=S_IFREG|0775, st_size=12520, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
+++ exited with 0 +++

/etc/localtimeって毎回参照するようなものだっけ?
今度は、perfでレポートを出してみる。

$ perf record -- ./minls ./too_many_files.d/ > /dev/null
[ perf record: Woken up 1 times to write data ]
[ perf record: Captured and wrote 0.003 MB perf.data (61 samples) ]

$ perf report --stdio -q
    18.03%  minls    libc-2.17.so   [.] vfprintf
    13.11%  minls    libc-2.17.so   [.] __strftime_internal
     8.20%  minls    libc-2.17.so   [.] _IO_vfscanf
     6.56%  minls    libc-2.17.so   [.] __offtime
     6.56%  minls    libc-2.17.so   [.] _int_malloc
     4.92%  minls    libc-2.17.so   [.] __tz_compute
     3.28%  minls    libc-2.17.so   [.] _IO_file_xsputn@@GLIBC_2.2.5
     3.28%  minls    libc-2.17.so   [.] __memcpy_sse2
     3.28%  minls    libc-2.17.so   [.] __memset_sse2
     3.28%  minls    libc-2.17.so   [.] __readdir64
     3.28%  minls    libc-2.17.so   [.] __tzfile_compute
     3.28%  minls    libc-2.17.so   [.] _int_free
     1.64%  minls    libc-2.17.so   [.] _IO_old_init
     1.64%  minls    libc-2.17.so   [.] _IO_vsscanf
     1.64%  minls    libc-2.17.so   [.] __GI_____strtoull_l_internal
     1.64%  minls    libc-2.17.so   [.] __memcmp_sse2
     1.64%  minls    libc-2.17.so   [.] __strchrnul
     1.64%  minls    libc-2.17.so   [.] __strdup
     1.64%  minls    libc-2.17.so   [.] __tz_convert
     1.64%  minls    libc-2.17.so   [.] __tzfile_read
     1.64%  minls    libc-2.17.so   [.] fprintf
     1.64%  minls    libc-2.17.so   [.] free
     1.64%  minls    libc-2.17.so   [.] getenv
     1.64%  minls    libc-2.17.so   [.] parse_tzname
     1.64%  minls    libc-2.17.so   [.] tzset_internal
     1.64%  minls    minls          [.] main

printf系が遅いのはいつものことなので一旦無視するが、コードには使用していないgetenv()がいやがる。
ああ、そうだ。localtime()が参照するのは TZ環境変数だったはず。

試しに TZ環境変数の有無でstat()の回数が減るのか確認をしてみると、TZを設定すると/etc/localtimeファイルへのアクセスが表面上はなくなっている。

$ strace -f -e stat,open ./minls test.d
open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3
open("/lib64/libc.so.6", O_RDONLY|O_CLOEXEC) = 3
stat("test.d/.", {st_mode=S_IFDIR|0775, st_size=42, ...}) = 0
open("/etc/localtime", O_RDONLY|O_CLOEXEC) = 4
stat("test.d/..", {st_mode=S_IFDIR|0775, st_size=4096, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
stat("test.d/test1", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
stat("test.d/test2", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
stat("test.d/test3", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
stat("/etc/localtime", {st_mode=S_IFREG|0644, st_size=292, ...}) = 0
+++ exited with 0 +++

$ export TZ=JST-9
$ strace -f -e stat,open ./minls test.d
open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3
open("/lib64/libc.so.6", O_RDONLY|O_CLOEXEC) = 3
stat("test.d/.", {st_mode=S_IFDIR|0775, st_size=42, ...}) = 0
open("/usr/share/zoneinfo/JST-9", O_RDONLY|O_CLOEXEC) = -1 ENOENT (No such file or directory)
stat("test.d/..", {st_mode=S_IFDIR|0775, st_size=4096, ...}) = 0
stat("test.d/test1", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
stat("test.d/test2", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
stat("test.d/test3", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
+++ exited with 0 +++

もっとも、localtime()を使わず、localtime_r()を使ったほうが良いようだ。

        if (stat(fpath, &st) != -1) {
            struct tm t;
            localtime_r( &st.st_mtime, &t );
            strftime(timestr, sizeof(timestr), "%Y-%m-%dT%H:%M:%S", &t);
            fprintf(stdout, "{ filename = %s, timestamp = %s }\n", fpath, timestr);
        }

localtime_r()に変更してstraceをすると、初回は/etc/localtimeへアクセスするが、2回目以降は/etc/localtimeへのアクセスはなくなっているようにみえる。

$ unset TZ
$ strace -f -e stat,open ./minls test.d
open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3
open("/lib64/libc.so.6", O_RDONLY|O_CLOEXEC) = 3
stat("test.d/.", {st_mode=S_IFDIR|0775, st_size=42, ...}) = 0
open("/etc/localtime", O_RDONLY|O_CLOEXEC) = 4
stat("test.d/..", {st_mode=S_IFDIR|0775, st_size=4096, ...}) = 0
stat("test.d/test1", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
stat("test.d/test2", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
stat("test.d/test3", {st_mode=S_IFREG|0664, st_size=0, ...}) = 0
+++ exited with 0 +++

結果

## localtime
$ time  ./minls2 ./too_many_files.d > /dev/null

real    0m0.037s
user    0m0.016s
sys     0m0.021s

## localtime + TZ環境変数
$ export TZ=JST-9
$ time  ./minls2 ./too_many_files.d > /dev/null

real    0m0.020s
user    0m0.011s
sys     0m0.010s

## localtime_r
$ unset TZ
$ time  ./minls1 ./too_many_files.d > /dev/null

real    0m0.019s
user    0m0.015s
sys     0m0.004s

このあたりのどれかで落ち着きました。

  • localtime()ではなくlocaltime_r()を使う
  • localtime()の場合はTZ環境変数を設定してもらう
  • localtime()の場合はTZ環境変数へsetenv()する (tm構造体のtm_zoneとtm_gmtoffをごにょごにょする)
dharry
SolarisとLinuxとWindowsは好きだけどHP-UXは嫌いです。
http://dharry.hatenablog.com/
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away