在中已经提到了uImage是一个压缩的包并且内含压缩程序,可以进行自解压。自解压完成之后内核代码从物理地址为0x30008000处开始运行。下面分析在进入C之前内核做的一些工作,以下是内核启动过程中打印出来的信息,其中Uncompressing Linux就是在自解压代码。make uImage编译的最后也给出了链接脚本arch/arm/kernel/vmlinux.lds,以及链接的顺序arch/arm/kernel/head.o 是第一个。
分析arch/arm/kernel/vmlinux.lds可以知道程序入口的地址是stext,并且是.text.head段
277 OUTPUT_ARCH(arm)278 ENTRY(stext)291 . = (0xc0000000) + 0x00008000;292293 .text.head : {294 _stext = .;295 _sinittext = .;296 *(.text.head)297 }
打开arch/arm/kernel/head.s。可见内核运行的第一条代码就是第79行的代码,从这条开始分析,首先将CPU设置为管理模式,并且关闭所有中断;然后获得CPU的id。
76 .section ".text.head", "ax" //.text.head段77 .type stext, %function78 ENTRY(stext) //入口地址stext79 msr cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode//确保进入了管理模式80 @ and irqs disabled //并且禁止中断81 mrc p15, 0, r9, c0, c0 @ get processor id //获得处理器的CPU id,并且存入 r9中82 bl __lookup_processor_type @ r5=procinfo r9=cpuid //调用函数,输入参数r9=cpuid。返回值r5=procinfo83 movs r10, r5 @ invalid processor (r5=0)?//如果不支持当前CPU,则r5=084 beq __error_p @ yes, error 'p' //如果r5=0,则打印错误85 bl __lookup_machine_type @ r5=machinfo //调用函数,r5=返回值machinfo86 movs r8, r5 @ invalid machine (r5=0)? //如果不支持当前单板,则返回r5=087 beq __error_a @ yes, error 'a' //如果r5=0,则打印错误88 bl __create_page_tables//创建一级页表以建立虚拟地址到物理地址的映射关系,后面再研究
接着调用__lookup_processor_type,它位于arch\arm\kernel\head-common.S。它的功能是比较当前CPU的id与内核支持的CPU的id是否相符合。这段代码在.proc.info.init段中从__proc_info_begin开始到__proc_info_end结束,寻找符合当前CPU的ID号的proc_info_list结构
145 .type __lookup_processor_type, %function146 __lookup_processor_type:147 adr r3, 3f //r3 = 第178行代码的物理地址148 ldmda r3, {r5 - r7} //将r3地址开始的3个地址的内容赋给 r5、r6、r7 ;r5=__proc_info_begin,r6=__proc_info_end149 sub r3, r3, r7 @ get offset between virt&phys//r3=r3-r7,即物理地址与虚拟地址的差值150 add r5, r5, r3 @ convert virt addresses to//r5=__proc_info_begind对应的物理地址151 add r6, r6, r3 @ physical address space //r6=__proc_info_end对应的物理地址152 1: ldmia r5, {r3, r4} @ value, mask//r3、r4等于proc_info_list结构中的cpu_val、cpu_mask153 and r4, r4, r9 @ mask wanted bits//r4=r4&r9=cpu_mask&传入的cpuid154 teq r3, r4 //比较155 beq 2f //如果相等,则找到对应的proc_info_list结构,跳到160行156 add r5, r5, #PROC_INFO_SZ @ sizeof(proc_info_list)//r5指向下一个proc_info_list结构157 cmp r5, r6 //是否已经比较完所有proc_info_list158 blo 1b //没有则继续比较159 mov r5, #0 @ unknown processor//比较完毕,但是没有找到匹配的proc_info_list结构,r5=0160 2: mov pc, lr//返回,返回的值为r5=proc_info_list176 .long __proc_info_begin177 .long __proc_info_end178 3: .long .//.表示当前这条代码链接后的虚拟地址179 .long __arch_info_begin180 .long __arch_info_end
其中__proc_info_begin、__proc_info_end被定义在arch\arm\kernel\vmlinux.lds中,它的意思是内核源码中有被定义为.proc.info.init的内容,它的起始地址是__proc_info_begin,结束地址为__proc_info_end。
299 .init : { /* Init code and data */230 *(.init.text)231 _einittext = .;232 __proc_info_begin = .;233 *(.proc.info.init)234 __proc_info_end = .;
接着看到proc_info_list结构的内容,它被定义在include\asm-arm\Procinfo.h中
29 struct proc_info_list {30 unsigned int cpu_val; 31 unsigned int cpu_mask;32 unsigned long __cpu_mm_mmu_flags; /* used by head.S */33 unsigned long __cpu_io_mmu_flags; /* used by head.S */34 unsigned long __cpu_flush; /* used by head.S */35 const char *arch_name;36 const char *elf_name;37 unsigned int elf_hwcap;38 const char *cpu_name;39 struct processor *proc;40 struct cpu_tlb_fns *tlb;41 struct cpu_user_fns *user;42 struct cpu_cache_fns *cache;43 };
接着找到对于当前内核支持的proc_info_list 定义,它在arch\arm\mm\proc-arm920.S 中。对于S3C2410、S3C2440芯片来说CPU ID都是0x41129200。cpu_val的值为0x41009200、cpu_mask的值为0xff00fff0,刚好匹配。
.section ".proc.info.init", #alloc, #execinstr448 .type __arm920_proc_info,#object449 __arm920_proc_info:450 .long 0x41009200//cpu_val值451 .long 0xff00fff0//cpu_mask值452 .long PMD_TYPE_SECT | \453 PMD_SECT_BUFFERABLE | \454 PMD_SECT_CACHEABLE | \455 PMD_BIT4 | \456 PMD_SECT_AP_WRITE | \457 PMD_SECT_AP_READ458 .long PMD_TYPE_SECT | \459 PMD_BIT4 | \460 PMD_SECT_AP_WRITE | \461 PMD_SECT_AP_READ462 b __arm920_setup463 .long cpu_arch_name464 .long cpu_elf_name465 .long HWCAP_SWP | HWCAP_HALF | HWCAP_THUMB466 .long cpu_arm920_name467 .long arm920_processor_functions468 .long v4wbi_tlb_fns469 .long v4wb_user_fns470 #ifndef CONFIG_CPU_DCACHE_WRITETHROUGH471 .long arm920_cache_fns472 #else473 .long v4wt_cache_fns474 #endif475 .size __arm920_proc_info, . - __arm920_proc_info
继续回到arch/arm/kernel/head.s往下分析,看到第83行,调用完__lookup_processor_type后r5的值变为执向找到的proc_info_list 结构的地址。所以第83行与第84行比较r5是否为0,如果为0说明没有找到符合当前CPU的ID号,则打印错误。接着到85行,调用__lookup_machine_type,它同样位于arch\arm\kernel\head-common.S中,它的功能是比较当前单板的id与内核支持的单板的id是否相符合。这段代码在.arch.info.init段中从__arch_info_begin开始到__arch_info_end结束,寻找符合当前单板的ID号的machine_desc结构
176 .long __proc_info_begin177 .long __proc_info_end178 3: .long .//.表示当前这条代码链接后的虚拟地址179 .long __arch_info_begin180 .long __arch_info_end193 .type __lookup_machine_type, %function194 __lookup_machine_type:195 adr r3, 3b //r3=第178行的物理地址196 ldmia r3, {r4, r5, r6} //r4=r3。r5=__proc_info_end,r6=__proc_info_begin,取得的是虚拟地址197 sub r3, r3, r4 @ get offset between virt&phys//r3=r3-r4,取得物理地址与虚拟地址的偏差198 add r5, r5, r3 @ convert virt addresses to//r5=r5+r3,取得物理地址__proc_info_end199 add r6, r6, r3 @ physical address space //r6=r6+r3,取得物理地址__proc_info_begin200 1: ldr r3, [r5, #MACHINFO_TYPE] @ get machine type //r3=取得单板的编号201 teq r3, r1 @ matches loader number?//比较r3与r1是否相等,即linux是否支持uboot传入的单板202 beq 2f @ found //如果相等,则跳到207行,找到支持的单板,返回203 add r5, r5, #SIZEOF_MACHINE_DESC @ next machine_desc//r5执向下一个machine_desc结构204 cmp r5, r6 //是否已经比较完machine_desc结构?205 blo 1b //如果没有比较完,则跳到200行继续比较206 mov r5, #0 @ unknown machine //如果所有machine_desc都比较完了,r5=0207 2: mov pc, lr //返回
其中__arch_info_begin、__arch_info_end被定义在arch\arm\kernel\vmlinux.lds中,它的意思是内核源码中有被定义为.arch.info.init的内容,它的起始地址是__arch_info_begin,结束地址为__arch_info_end。
305 __arch_info_begin = .;306 *(.arch.info.init)307 __arch_info_end = .;
接着看到machine_desc结构的内容,它被定义在include\asm-arm\mach\Arch.h 中
17 struct machine_desc {18 /*19 * Note! The first four elements are used20 * by assembler code in head-armv.S21 */22 unsigned int nr; /* architecture number */ //单板的编号,是从内核传过来的编号 r123 unsigned int phys_io; /* start of physical io */24 unsigned int io_pg_offst; /* byte offset for io 25 * page tabe entry */2627 const char *name; /* architecture name */28 unsigned long boot_params; /* tagged list *///boo传过来的tag标记的位置,也是从内核传过来的 r22930 unsigned int video_start; /* start of video RAM */31 unsigned int video_end; /* end of video RAM */3233 unsigned int reserve_lp0 :1; /* never has lp0 */34 unsigned int reserve_lp1 :1; /* never has lp1 */35 unsigned int reserve_lp2 :1; /* never has lp2 */36 unsigned int soft_reboot :1; /* soft reboot */37 void (*fixup)(struct machine_desc *,38 struct tag *, char **,39 struct meminfo *);40 void (*map_io)(void);/* IO mapping function *///IO映射函数,移植时需要关注41 void (*init_irq)(void);42 struct sys_timer *timer; /* system tick timer */43 void (*init_machine)(void);44 };
接着需要找到对于当前内核支持的machine_desc定义,在include\asm-arm\mach\Arch.h 中有如下宏定义,它表示在.arch.info.init段存入一个machine_desc 的结构体,名称为
__mach_desc_type,结构体内.nr、.name初始化为MACH_TYPE_type、_name
50 #define MACHINE_START(_type,_name) \51 static const struct machine_desc __mach_desc_##_type \52 __used \53 __attribute__((__section__(".arch.info.init"))) = { \54 .nr = MACH_TYPE_##_type, \55 .name = _name,56 57 #define MACHINE_END \58 };
接着找调用MACHINE_START这个宏的文件,在arch\arm\mach-s3c2440\Mach-smdk2440.c 找到了,所以单板的ID为MACH_TYPE_S3C2440,它被定义在include\asm-arm\Mach-types.h中
#define MACH_TYPE_S3C2440 362。与UBOOT传入的参数相符合。
339 MACHINE_START(S3C2440, "SMDK2440")340 /* Maintainer: Ben Dooks*/341 .phys_io = S3C2410_PA_UART,342 .io_pg_offst = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,343 .boot_params = S3C2410_SDRAM_PA + 0x100,344345 .init_irq = s3c24xx_init_irq,346 .map_io = smdk2440_map_io,347 .init_machine = smdk2440_machine_init,348 .timer = &s3c24xx_timer,349 MACHINE_END
继续来看MACHINE_START(S3C2440, "SMDK2440")这个宏,在里面有许多和开发板相关的设置,比如说smdk2440_map_io,它被定义在arch\arm\mach-s3c2440\Mach-smdk2440.c中,在中提到过想要移植成功,必须修改327行代码,将晶振的设置改为12000000。还有其它的一些配置就不一一列举了。
324 static void __init smdk2440_map_io(void)325 {326 s3c24xx_init_io(smdk2440_iodesc, ARRAY_SIZE(smdk2440_iodesc));327 s3c24xx_init_clocks(12000000);//根据开发板合适的晶振配置328 s3c24xx_init_uarts(smdk2440_uartcfgs, ARRAY_SIZE(smdk2440_uartcfgs));329 }
回到arch/arm/kernel/head.s接着往下看,86、87行判断__lookup_machine_type是否成功找到支持单板的machine_desc结构,如果没找到则打印错误,88行是用来创建一级页表以建立虚拟地址到物理地址的映射关系,这里不详细分析。
继续往下看,看到100行,其中r10的值为__arm920_proc_info所在地址,PROCINFO_INITFUNC为proc_info_list结构体的偏移量,具体为__cpu_flush,对应到__arm920_proc_info结构体内,pc的值就是b __arm920_setup这条语句所在地址,即执行b __arm920_setup这条指令,__arm920_setup做一些MMU相关的初始化,在arch\arm\mm\proc-arm920.S中,这里不做细究。
97 ldr r13, __switch_data @ address to jump to after//r13是堆栈寄存器sp98 @ mmu has been enabled99 adr lr, __enable_mmu @ return (PIC) address //100行设置完成之后在使能MMU100 add pc, r10, #PROCINFO_INITFUNC//调用__arm920_setup函数,应该跟MMU相关,后面再研究
b __arm920_setup执行完毕返回之后执行的是arch/arm/kernel/head.s下的__enable_mmu 。
152 .type __enable_mmu, %function153 __enable_mmu:.....174 b __turn_mmu_on187 .align 5188 .type __turn_mmu_on, %function189 __turn_mmu_on:190 mov r0, r0191 mrc p15, 0, r3, c0, c0, 0 @ read id reg192 mov r3, r3193 mov r3, r3194 mov pc, r13//设置完MMU之后跳转到__switch_data执行
__enable_mmu 执行完之后进入__switch_data执行,注意这时候的运行地址已经是初始化MMU之后的虚拟地址了。从15-24行可以看出pc=__mmap_switched,__mmap_switched的主要工作是将processor_id与__machine_arch_type初始化为当前MCU的编号与单板的编号
14 .type __switch_data, %object15 __switch_data:16 .long __mmap_switched17 .long __data_loc @ r418 .long __data_start @ r519 .long __bss_start @ r620 .long _end @ r721 .long processor_id @ r4//之前找到的符合当前MCU的__arm920_proc_info结构体22 .long __machine_arch_type @ r5//之前找到的符合单板的__mach_desc_S3C2440结构体23 .long cr_alignment @ r624 .long init_thread_union + THREAD_START_SP @ sp2526 /*27 * The following fragment of code is executed with the MMU on in MMU mode,28 * and uses absolute addresses; this is not position independent.29 *30 * r0 = cp#15 control register31 * r1 = machine ID32 * r9 = processor ID33 */34 .type __mmap_switched, %function35 __mmap_switched://虚拟地址已经可以使用36 adr r3, __switch_data + 4//r3=__data_loc所在的地址3738 ldmia r3!, {r4, r5, r6, r7}//r4=__data_loc所在地址;r5=__data_start所在地址依次类推 r3=__switch_data+4*439 cmp r4, r5 @ Copy data segment if needed //检查是否有__data_loc段r4=r5说明没有__data_loc40 1: cmpne r5, r6 41 ldrne fp, [r4], #442 strne fp, [r5], #443 bne 1b4445 mov fp, #0 @ Clear BSS (and zero fp)//清0BSS段46 1: cmp r6, r747 strcc fp, [r6],#448 bcc 1b4950 ldmia r3, {r4, r5, r6, sp}//r4=processor_id、r5=__machine_arch_type、r6=cr_alignment、sp=init_thread_union + THREAD_START_SP51 str r9, [r4] @ Save processor ID//processor_id=r9 = proc_info_list.cpu_val = 0x4100920052 str r1, [r5] @ Save machine type//__machine_arch_type=r1 = machine_desc .nr = MACH_TYPE_S3C2440 = 36253 bic r4, r0, #CR_A @ Clear 'A' bit54 stmia r6, {r0, r4} @ Save control register values55 b start_kernel//跳转到start_kernel C函数
最终执行b start_kernel,跳到C函数,这是第二阶段的内容。