前言
( u& t D* w) J5 D0 g8 p4 k
+ O1 h! I; |2 Y9 `1 T' A3 a9 OLinux常用命令中有一些命令可以在开发或调试过程中起到很好的帮助作用,有些可以帮助了解或优化我们的程序,有些可以帮我们定位疑难问题。本文将简单介绍一下这些命令。
( r( W; r. Q3 e示例程序3 G# \! I5 B( v2 j- Z& Y' t
2 [9 x# a. d G1 l1 l我们用一个小程序,来帮助后面我们对这些命令的描述,程序清单cmdTest.c如下:: c) H+ a, r/ X. Q% x. C4 y
#include<stdio.h>
; Q7 Q* S* y, k! I* Q1 R5 wint test(int a,int b)' L) k, E5 D: @9 H* {
{+ o) Q Z- ^% X# u9 S1 H
return a/b;& E$ y6 e5 L3 Q8 `* d
}
* |, C2 ^9 {) T/ Y( c5 rint main(int argc,char *argv[])
% a2 [4 V& n5 ~) r* q{) ^1 p( @) w( R; W0 o
int a = 10;
; D; o( p6 w% `! s int b = 0;0 x. f& b1 k- s) m8 S6 J: B6 i& m
printf("a=%d,b=%d\n",a,b);- n a" C- S4 U" [) r9 u( ]
test(a,b);# Q# _/ K! i% d* }
return 0;; n+ M8 d" p2 ~# I$ u
}
* {* r5 y5 h! I8 D编译获得elf文件cmdTest并运行:
/ T6 t. s, F! C4 d9 y1 {gcc -g -o cmdTest cmdTest.c; M, E/ T# i; E
./cmdTest* a- t: D6 x u# F# u, x, @$ `% c
a=10,b=0" O n7 e2 y) z: r* y- V
Floating point exception (core dumped)
7 e( C9 l5 c% h& E/ E程序内容是在main函数中调用test,计算a/b的值,其中b的值为0,因此程序由于除0错误异常终止。! l# v7 w/ u1 g4 ]$ H
查看文件基本信息--file0 s2 U( N/ @% T& i8 _ f
1 a: @ S6 y! u; }
file cmdTest
9 n* R4 U: w/ S( i2 EcmdTest: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.24, BuildID[sha1]=448e1c34b4c548120e2c04f6a2bfce4e6d2281a3, not stripped
6 O+ Z( Z1 ^2 m" g* ?通过file命令可以看到cmdTest的类型为elf,是64位、运行于x86-64的程序,not striped表明elf文件中还保留着符号信息以及调试信息等不影响程序运行的内容。4 {4 x8 u* w1 U& A+ _! j5 Y
查看程序依赖库--ldd3 P+ }9 t8 L9 v% \2 H7 x
, y) Z; h, s+ s$ A
ldd cmdTest
2 J( D0 I4 t: {1 ? R! L& M linux-vdso.so.1 => (0x00007ffc8e548000)
& v( J* k7 O( t ~8 a) D libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f0621931000)& i' n! a/ j* Y( [6 c7 t3 G6 L
/lib64/ld-linux-x86-64.so.2 (0x00007f0621cf6000)
& W. v4 q: p6 P我们可以看到cmdTest依赖了libc.so等库。
5 J# M" o, e$ i' ^查看函数或者全局变量是否存在于elf文件中--nm
7 Q2 R2 R: x+ m! f6 R. ?
6 x6 ]$ V& }* H$ Nnm命令用于查看elf文件的符号信息。文件编译出来之后,我们可能不知道新增加的函数或者全局变量是否已经成功编译进去。这时候,我们可以使用nm命令来查看。
/ N' t/ u9 R, q7 U例如,查看前面所提到的elf文件有没有test函数,可以用命令:
* Y$ K4 a5 d5 W G, F$ ]' [nm cmdTest|grep test
0 @; \9 z$ q! J' e5 i000000000040052d T test #打印结果- V% m# w" @2 F6 Q3 `; a4 a* y
按照地址顺序列出符号信息:1 Y1 Q$ y; X( g5 q' X+ U/ n' o
nm -n cmdTest
. \( C* A4 w+ R$ ?; {/ {2 j( o w _ITM_deregisterTMCloneTable
6 s+ x3 U2 f0 V% Q* ~0 } w _ITM_registerTMCloneTable0 |3 x% {. E2 Z
w _Jv_RegisterClasses
9 s' s. W4 J8 e$ B9 I2 m8 J w __gmon_start__
6 Q, u7 e% q: y8 q1 i U __libc_start_main@@GLIBC_2.2.5
) i% l, n' C! Z8 F0 } U printf@@GLIBC_2.2.5# A1 g2 Q' D1 \& y8 ^
00000000004003e0 T _init
5 m4 e2 Y, n/ w* N% a" a0 V$ e0000000000400440 T _start' W6 q$ G" @2 w6 I
0000000000400470 t deregister_tm_clones1 l' t4 c' V, ^' X4 x$ P
00000000004004a0 t register_tm_clones+ t# S. S, b5 @1 J& b+ d$ h. ?
00000000004004e0 t __do_global_dtors_aux
# G, `2 j# a4 A [! ?0000000000400500 t frame_dummy- O3 e6 [) o+ @1 K6 v# f
000000000040052d T test5 n, { {8 {" A7 W9 r3 w7 Z9 a
0000000000400540 T main
# R, U) Y* e( x- Y2 V0000000000400590 T __libc_csu_init
. X) ?7 T/ o' i1 ~1 H0000000000400600 T __libc_csu_fini; k# a3 b$ u& a* @ N z, U2 V5 f5 U
(列出部分内容)6 ?! ]; L6 G# ?$ e3 f- M
可以看到test函数的开始地址为0x000000000040052d,结束地址为0x0000000000400540。& {" f+ j' e0 b: A* \: E* \: I
打印elf文件中的可打印字符串--strings; B5 E2 |; B% @. m1 [' E
T# Z5 y) ?# p) _- g1 r9 b$ n2 H i
例如你在代码中存储了一个版本号信息,那么即使编译成elf文件后,仍然可以通过strings搜索其中的字符串甚至可以搜索某个.c文件是否编译在其中:
) j3 Y) j3 O" h8 wstrings elfFile| grep "someString"
, H( o) h( C0 t$ t" c8 }9 ]$ v查看文件段大小--size
- ]+ P# q9 l# U0 c( Q
2 ~# W+ l/ H6 d; X7 Z$ v4 Z" l2 {# F可以通过size命令查看各段大小:: h Q) H- ?! _. s
size cmdTest
* }- M6 r2 E; Q1 l; M9 R. l* d text data bss dec hex filename
; B6 \( V' x* Q3 t0 y0 j* j. S 1319 560 8 1887 75f cmdTest
& q6 j* Y1 W3 c7 @text段:正文段字节数大小
+ \& A% e$ ^: G5 V# y3 r3 K" gdata段:包含静态变量和已经初始化的全局变量的数据段字节数大小! d0 o; `# g7 t0 G
bss段:存放程序中未初始化的全局变量的字节数大小
/ D& e' R( o: t7 i/ `4 t当我们知道各个段的大小之后,如果有减小程序大小的需求,就可以有针对性的对elf文件进行优化处理。' t+ A8 f, M3 d
为elf文件”瘦身“--strip* P; P6 S; s( v `+ o
I; k- a' E2 D9 n# a% _strip用于去掉elf文件中所有的符号信息: p F' ]- _+ l- L* o( B$ s
ls -al cmdTest. z( V- Y0 c7 V) t+ |, @# ]
-rwxr-xr-x 1 hyb root 9792 Sep 25 20:30 cmdTest #总大小为9792字节
- e; \" n5 z$ Z6 dstrip cmdTest7 g5 b; {) K, \7 \) R9 w/ I% V
ls -al cmdTest6 \5 `1 H- V2 I2 J" v2 _
-rwxr-xr-x 1 hyb root 6248 Sep 25 20:35 cmdTest#strip之后大小为6248字节4 y: I; y; Z6 ?. K3 s+ k0 ~
可以看到,“瘦身”之后,大小减少将近三分之一。但是要特别注意的是,“瘦身”之后的elf文件由于没有了符号信息,许多调试命令将无法正常使用,出现core dump时,问题也较难定位,因此只建议在正式发布时对其进行“瘦身”。
: L" s1 E, F: R/ f2 M) Q8 e5 ]查看elf文件信息--readelf) o, |& ^" W0 M: v l5 x7 K- }' E
& {" p( ?4 s$ F# s$ hreadelf用于查看elf文件信息,它可以查看各段信息,符号信息等,下面的例子是查看elf文件头信息:& u% O- T; t- O& o" R& M
readelf -h cmdTest* Z( q. W6 Z. W% V1 F
Magic: 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00 #elf文件魔数字2 }7 N6 M$ O7 m* Q
Class: ELF64 #64位 elf文件; N! O/ r* n0 a D, g
Data: 2's complement, little endian#字节序为小端序
# q7 s) {9 N! g% H& j* n3 D9 n: q" m Version: 1 (current)& W; i4 E: O- H
OS/ABI: UNIX - System V #( W$ E8 O8 D$ B% b
ABI Version: 0( s/ l1 e$ ^9 a, |3 p+ j7 Z/ l/ T
Type: EXEC (Executable file)#目标文件类型& r# n" C8 L+ r8 h( _6 M1 `% ^
Machine: Advanced Micro Devices X86-64 #目标处理器体系* }$ q# P/ H. D3 o6 V% e1 I3 K
Version: 0x1
2 b9 @: i* B1 k Entry point address: 0x400440 #入口地址+ c) X( Y4 b4 `3 k$ L/ `6 ]
Start of program headers: 64 (bytes into file)
5 L7 h4 ]. c! N8 o7 K Start of section headers: 4456 (bytes into file)! L" x' |. m' E
Flags: 0x0
" q* Y% n- k/ O) z; x, ]' f, q Size of this header: 64 (bytes)
$ w8 p9 s: {3 b Size of program headers: 56 (bytes)
0 j# g I* T# w8 O7 ~5 i; p Number of program headers: 9
4 V/ b' w. @% Q- R5 G3 `4 V, m: O Size of section headers: 64 (bytes)
6 ?6 `/ \; v9 N Number of section headers: 28& d7 F2 a8 l$ B. k: R
Section header string table index: 27 r, i7 e! u, e' p9 r
从elf头信息中,我们可以知道该elf是64位可执行文件,运行在x86-64中,且字节序为小端序。另外,我们还注意到它的入口地址是0x400440(_start),而不是400540(main)。也就是说,我们的程序运行并非从main开始。/ P' z* _0 f; f# I4 \
反汇编指定函数--objdump. j) r& P# H! X f. S2 K6 O
: ?. d, V7 U8 b# W
objdump用于展示elf文件信息,功能较多,在此不逐一介绍。有时候我们需要反汇编来定位一些问题,可以使用命令:6 [1 Q1 d5 K6 \8 [( l9 q
objdump -d cmdTest #反汇编整个cmdTest程序: M$ g P K5 n1 |$ ? K
但是如果程序较大,那么反汇编时间将会变长,而且反汇编文件也会很大。如果我们已经知道了问题在某个函数,只想反汇编某一个函数,怎么处理呢?7 O, B. d4 s2 t: P3 q7 r' H5 x
我们可以利用前面介绍的nm命令获取到函数test的地址,然后使用下面的方式反汇编:
/ }. |' z/ X6 g, ?( o B) tobjdump -d cmdTest --start-address=0x40052d --stop-address=0x400540 ##反汇编指定地址区间
8 |, {- ` y" n1 i4 \5 `3 J+ f, Q端口占用情况查看--netstat: H6 g# I, a+ V2 w+ H3 H; u
& m( P. L: G, _) e, M! S
我们可能常常会遇到进程第一次启动后,再次启动会出现端口绑定失败的问题,我们可以通过netstat命令查看端口占用情况:" p v! I9 q) [0 Y: {
netstat -anp|grep 端口号
* H( z& L. ~0 X x* M9 A进程状态查看--ps&top4 }( ?, T% r8 a9 q2 I
$ b! P- g1 A) l! c5 I. L& F
ps命令的用法可以参考ps命令常见实用用法。
1 Z6 _$ k, ^1 wtop命令实时显示当前进程状态,最活跃的进程显示在最顶部。
3 w0 C5 D9 u7 z$ n) d- C/ \* b( r" g/ ncore dump文件生成配置--ulimit -c
C% v3 Y9 S: y0 z- e
( g! v) H9 C+ d# |+ M有时候我们的程序core dump了却没有生成core文件,很可能是我们设置的问题:3 {/ v3 C' Z. h1 S; E
ulimit -c #查看core文件配置,如果结果为0,程序core dump时将不会生成core文件
- e1 i: ^+ K" ~+ m9 kulimit -c unlimited #不限制core文件生成大小
. ~1 f, p/ D/ S0 V* E+ sulimit -c 10 #设置最大生成大小为10kb
2 k+ ~1 G, B# V8 F3 u调试神器--gdb- j1 v) m+ g1 A! i
9 [$ q) a: j: k/ w _+ W! o( Egdb是一个强大的调试工具,但这里仅介绍两个简单使用示例。
* x$ e$ a" ]2 U3 Y有时候程序可能已经正在运行,但是又不能终止它,这时候仍然可以使用gdb调试正在运行的进程:
" Z. P* a: @# q+ `( `3 Dgdb processFile PID #processFile为进程文件,pid为进程id,可通过ps命令查找到3 ^$ p8 l( B- h$ X4 l8 |5 l! g
有时候程序可能core dump了,但是系统还留给了我们一个礼物--core文件。. n8 ?2 i* d6 |& M1 m* ^
在core文件生成配置完成之后,运行cmdTest程序,产生core文件。我们可以用下面的方法通过core文件定位出错位置:3 h* C6 ]; J3 E
gdb cmdTest core #processFile为进程文件,core为生成的core文件+ [) q. n: C8 e6 h
Core was generated by `./cmdTest'.4 Z1 t# L7 M5 F+ q6 H
Program terminated with signal SIGFPE, Arithmetic exception.
. S& p; i" R7 @ S* L( j#0 0x00000000004004fb in test (a=10, b=0) at cmdTest.c:4
! h; O* W+ M" h/ |. r6 T! g% n4 return a/b;
/ R' s2 W8 ~0 h(gdb)bt! i9 ?0 a: g8 }9 I
#0 0x00000000004004fb in test (a=10, b=0) at cmdTest.c:4+ r1 f, M( f6 t
#1 0x000000000040052c in main (argc=1, argv=0x7ffca9536d38) at cmdTest.c:10
$ x7 c: [6 ?: A1 ~& K2 j(gdb); \& m# W5 H9 Y- `
输入bt后,就可以看到调用栈了,出错位置在test函数,cmdTest.c的第4行。7 k+ o- J/ _ P
定位crash问题--addr2line
0 U @4 Q( b7 h$ Z) W K5 {5 m- n5 R' n
有时候程序崩溃了但不幸没有生成core文件,是不是就完全没有办法了呢?还是cmdTest的例子。运行完cmdTest之后,我们通过dmesg命令可以获取到以下内容
; k, `7 s/ ?! z1 e( @6 r2 L[27153070.538380] traps: cmdTest[2836] trap divide error ip:40053b sp:7ffc230d9280 error:0 in cmdTest[400000+1000]: ~: g, v7 D" ]8 ~6 A
该信息记录了cmdTest运行出错的基本原因(divide error)和出错位置(40053b),我们使用addr2line命令获取出错具体行号:$ Q6 S4 B; B$ p
addr2line -e cmdTest 40053b
4 l6 H, ^& O B) {4 l4 ^/home/hyb/practice/cmdTest.c:4/ h) b. l& G! o; i5 ^0 A. N
可以看到addr2line命令将地址(40053b)翻译成了文件名(cmdTest.c)和行号(4),确定了出错位置。$ ? O2 {* X; d1 J/ {
总结
1 C/ z5 F2 `+ @9 w/ \0 `
7 ]5 S1 {; ~; f8 c* j本文对以上命令仅介绍其经典使用,这些命令都还有其他一些有帮助的用法,但由于篇幅有限,不在此介绍,更多使用方法可以通过man 命令名的方式去了解。
|