Linux Assembly Code


글쓴이 : 이호 (i@flyduck.com)
최신 글이 있는 곳 : http://linux.flyduck.com/

v0.1.0 2000년 3월 28일


차례


0. 서문

이 문서는 리눅스에서 사용하는 어셈블리 문법에 대해서 (특히 x86에서) 간략히 요약한 글입니다. GAS와 AT&T 문법에서는 어셈블리 코드의 형식과 이것이 인텔에서 사용하는 문법과 어떤 차이가 있는지를 나타냅니다. 이 부분은 인텔에서 사용하는 어셈블리(Macro Assembler나 Turbo Assembler)를 알고 있다면 많은 도움이 될 것입니다. Inline Assembly는 C 코드내에서 어셈블리 코드를 사용하는 방법에 대한 글입니다. 커널 코드에서 CPU에 의존적인 부분들의 상당수는 inline 어셈블리 코드로 작성되어 있는데, 이 형식에 낯선 사람들이 이를 이해하는데 도움이 되리라 생각합니다. 이 글은 x86 어셈블리 코드에 대해 기본적인 지식이 있다고 가정하고 있습니다.

이 문서는 Linux Assembly HOWTO 문서와 Brennen's Guide to Inline Assembly, DJGPP QuickASM Programming Guide, GCC Manual, GAS Manual에 있는 내용을 요약 정리한 것입니다. 그대로 사용한 코드들도 많아서 어떤 면에서는 정리했다기 보다는 그냥 옮겼다고 해도 무방할 듯 합니다 (^^;). 여기서 다루는 내용외에 더 자세한 것을 바란다면 마지막 장 Reference에 나오는 문서들을 보시기 바랍니다. 특히 x86 Assembly Language FAQ 문서는 어셈블리에 대해서 낯선 분에게도 큰 도움이 될 것입니다. 실제 CPU 명령어에 대해서는 각 CPU 제조회사에서 제공하는 매뉴얼을 참조하시기 바랍니다. 그럼 리눅스를 공부하시는 분께 도움이 되길 바랍니다.


1. GAS와 AT&T 문법

GAS는 GNU Assembler로서 GCC와 함께 쌍으로 사용되는 Assembler이다. 이는 32-bit UNIX Compiler를 위해 만들어졌으므로, UNIX에서 일반적으로 사용되는 AT&T 문법을 따른다. 이 문법은 Intel에서 사용하는 문법과는 많이 다르다. 이를 비교해보면 :


2. Inline Assembly

inline assembly는 high-level 언어로 된 코드 중간에 넣어서 사용하는 어셈블리 코드로, 네가지 항목으로 구성되며, 다음과 같은 형식으로 사용한다.

__asm__(어셈블리 문장 : 출력 : 입력 : 변경된 레지스터);

각 항목은 콜론(':')으로 구분되며, 어셈블리 문장은 반드시 들어가야 하지만, 뒤의 세 항목은 필요에 따라서 넣거나 생략할 수 있다. 각 항목은 다음과 같은 의미를 가진다.

예제 코드를 보면 :

	__asm__ ("pushl %eax\n"
		"movl 	$1, %eax\n "
		"popl 	%eax"
		);

이 코드는 eax 레지스터를 저장하고 여기에 1을 입력했다가 eax 레지스터를 원래의 값으로 복구하는 코드이다. 여기서는 아무런 입력이나 출력이 없으며, 변경되는 레지스터도 없으므로 어셈블리 코드만 존재한다. 이제 i라는 변수를 하나 증가시키는 코드를 만들어보자.

	int i = 0;

	__asm__	("pushl %%eax\n"
		"movl 	%0, %%eax\n"
		"addl	$1, %%eax\n"
		"movl 	%%eax, %0\n"
		"popl 	%%eax"
		: /* no output variable */
		: "g" (i)
		); 

우선 이 코드에서 모든 레지스터 앞에 %가 두개가 붙어있는데, 입력이나 출력, 변경된 레지스터 중의 하나라도 기술을 하는 경우, 레지스터 이름에는 %를 하나가 아니라 두개를 붙여야 한다. 이는 내부에서 %0, %1 하는 식의 기호가 사용되는데 이것과 혼동되는 것을 막기 위해서이다. 이 코드에서는 출력이 없으므로 출력은 비워 두었다. 입력에는 "g"(i)라고 적혀 있는데, 이는 i라는 변수를 %0과 연결시켜주는 역할을 한다. 즉 코드내에서 %0은 변수 i와 같은 의미로 사용된다. 따옴표 안에 있는 것은 변수와 어떤것이 연결되는지를 말하는데 g는 이경우 컴파일러가 알아서 레지스터에 넣던지 메모리에 두던지 하라고 지시하는 것이다. 따옴표 안에는 다음과 같은 것을 지정할 수 있다.

a	eax
b	ebx
c	ecx
d	edx
S	esi
D	edi
I	상수 (0에서 31) ("I"라고 사용하는게 아니라 "0" 처럼 숫자를 넣어서 사용)
q	eax, ebx, ecx, edx 중 동적으로 할당된 레지스터
r	eax, ebx, ecx, edx, esi, edi 중 동적으로 할당된 레지스터
g	eax, ebx, ecx, edx 또는 메모리에 있는 변수. 컴파일러가 선택
A	eax 와 edx를 결합한 64-bit 정수

%0은 입력에서 지정한 변수를 가리킨다. 즉 여기서는 i라는 변수를 가리키게 된다. 입력에서 여러개를 기술하면, 기술한 순서대로 차례로 %0, %1, ... 의 이름을 갖게 된다.

	int x = 1, x_times_5;

	__asm__ ("leal (%1, %1, 4), %0"
     		: "=r" (x_times_5)
     		: "r" (x) 
		);

위 코드는 x라는 변수를 다섯배 곱하여 x_times_5에 저장한다. ((%1, %1, 4) = %1 + %1 * 4 = %1 * 5, lea는 주소를 저장하라는 명령이므로 %0에 %1을 다섯배한 값이 들어가게 된다). 여기서는 결과를 저장해야 하므로 출력에 "=r"(x_times_5)라고 출력되는 변수를 지정하였다. 따옴표안에 =가 들어가는 것은 출력임을 나타내기 위해서이다. 이 코드를 조금 수정하여 x를 다섯배 곱하여 x에 이 값을 넣는다면 :

	__asm__ ("leal (%1,%1,4), %0"
     		: "=r" (x)
     		: "0" (x) 
		);

여기서 입력에 "0"이라고 숫자로 썼는데, 이는 앞에서 지시한 것을 다시 가리키는 경우이다. 순서에 따라 출력 "=r"은 %0, 입력 "0"은 %1이 되는데, 이 둘을 같은 것을 가리키게 하고 싶은 경우 "0"이라고 하여 %0과 같은 것이라고 지시해주는 것이다. 즉 여기서 %1은 %0과 같은 것이 된다. 그 래서 이 코드는 x를 다섯배를 곱하여 결과를 자기 자신에서 돌려주게 된다. 입출력을 같이 하는 예로 k = i + j를 예로 들면 :

	int i = 1, j = 2, k;
        	
	__asm__ __volatile__ ("pushl 	%%eax\n"
		"movl 	%1, %%eax\n"
		"addl 	%2, %%eax\n"
		"movl 	%%eax, %0\n"
		"popl 	%%eax"
		: "=g" (k)
		: "g" (i), "g" (j)
		);

순서에 따라 k = %0, i = %1, j = %2가 되고, %1 + %2를 %0에 저장하여 k = i + j 값이 들어가게 된다. 여기서 __asm__ 다음에 __volatile__가 있는데, 이는 이 코드를 지정한 위치에 그대로 두라는 것이다. 컴파일러는 최적화(optimization)를 하는 과정에서 코드의 위치를 옮길 수 있는데 이를 막는 것이다.

	#define rep_movsl(src, dest, numwords) \
		__asm__ __volatile__ ( \
			"cld\n" \
			"rep\n" \
			"movsl" \
			: \
			: "S" (src), "D" (dest), "c" (numwords) \
			: "%ecx", "%esi", "%edi" \
			);

위 코드는 src에서 dest로 지정한 길이만큼 복사하는 것이다. 이 코드를 실행하면 edx, esi, edi 레지스터가 변경되게 되므로, 마지막에 변경된 레지스터 목록에 이 세개를 지정해주었다.


3. Reference