|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
4 x: c4 ~- n( t
9 }5 e: O6 q2 M; @: `: W从IRQ到IRQL(APIC版)
. u8 r8 F, [. o/ b
, |5 Q* F+ I; }5 p+ P' n( w作者:SoBeIt7 k4 {2 `+ j4 F% h6 R' \
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
5 z) u; [$ ` j日期:2005-02-04$ p. R, Q, ]- @5 x4 g
5 u# p" C: s1 `* J0 }9 M9 Z- `
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。) N" Z* u l( g! d0 W$ g
, G3 }% |6 y7 w1 M9 V/ _7 G V 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。' W6 K( s" h1 ~$ k0 g2 u, z1 Q3 ^5 _
8 T" |3 ]% J! M# C* y, U" b
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。& Y: G- U/ j/ J6 {
/ t, [6 [% G* r 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:* u5 q3 w$ T) d5 U' } t W
; s9 q! o, Z) r( Q0 L#define ZERO_VECTOR 0x00 // IRQL 00
) X9 L8 J' y2 ?: d* V#define APC_VECTOR 0x3D // IRQL 01# k" t9 Z3 q" F9 ?) L
#define DPC_VECTOR 0x41 // IRQL 02
0 f& H) d& _4 w L6 b$ ?, h#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
( |) V3 q7 R& W) K$ Y4 _' V X#define APIC_CLOCK_VECTOR 0xD1 // IRQL 287 x6 r6 i& `& z. A' ?
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
# A$ J# N: F7 q5 v#define APIC_IPI_VECTOR 0xE1 // IRQL 29
7 z# G1 x% l2 m6 z* f% T#define POWERFAIL_VECTOR 0xEF // IRQL 30
5 C( ?9 [# | o& W i% j A#define APIC_PROFILE_VECTOR 0xFD // IRQL 31" m* x' u1 ]. j5 t: L4 N
' l ]* @( A2 E/ X0 s
+ b2 m7 v- P, k1 L8 U9 R! b现在看一下一些重要的数据:3 n; {0 f) l& R8 D& d5 I
5 J' k% n; u9 D! Q/ ]: R! u( I6 b
这是我写的代码输出的IO APIC重定向表内容:" m1 Y0 T6 V5 g- L! C) H
d; a9 W3 n( d4 z* n0 wRedirect Table Index: 0x17! V9 l. ?" M E9 v: X& h
Redirect Table[ 0]: ff5 |% D3 L0 R' H4 v9 a5 V
Redirect Table[ 1]: b3
; t: w; R2 p; V* M: O+ A" F0 CRedirect Table[ 2]: ff% r& n3 @0 \0 l3 V! W6 c
Redirect Table[ 3]: 51% G P0 Q, T: m' a A
Redirect Table[ 4]: ff$ b$ V9 L1 X) x0 C# m M
Redirect Table[ 5]: ff
/ p5 k# x0 v8 K# kRedirect Table[ 6]: 620 n7 s) w, ?( K- s' R- H, p7 ?
Redirect Table[ 7]: ff8 _& J! ^) P1 V1 a9 h
Redirect Table[ 8]: d17 `0 r5 z( ~) P2 i, g
Redirect Table[ 9]: b1
. J0 g( z3 F7 qRedirect Table[ a]: ff
! k1 F/ _9 u( U! i H* ~Redirect Table[ b]: ff
6 a5 k$ g9 m8 n$ HRedirect Table[ c]: 52/ W) i6 H$ T& n& _, l
Redirect Table[ d]: ff; e' M- |- S1 j, Z1 Z
Redirect Table[ e]: ff
" p& N. {4 H" c6 n# nRedirect Table[ f]: 92) e6 b- }" p8 ?6 n
Redirect Table[10]: ff' {9 f g" F2 l+ U( w
Redirect Table[11]: a39 k" ^# T5 H* d
Redirect Table[12]: 83
$ _0 f2 h, u4 t1 MRedirect Table[13]: 93
' e0 [7 m' D6 q8 i: C0 sRedirect Table[14]: ff$ Y$ H9 A5 A) o6 b, `. m) ? E
Redirect Table[15]: ff
0 p( d1 p6 C$ X& m8 x3 ~Redirect Table[16]: ff
+ \ y1 Y. e. @Redirect Table[17]: ff
* j) s) |, h# h& h8 d* F4 v$ ~+ C. V, Y ~) P* e& Y
这是IDT表中被注册的向量:3 H( \! d; C" e, v* g( S" V
! b. S4 k; P6 u6 a1f: 80064908 (hal!HalpApicSpuriousService)5 {- z/ Z% y" u( u2 ^2 h7 m
37: 800640b8 (hal!PicSpuriousService37)
5 Y2 h/ x6 W$ ?) v; Z3d: 80065254 (hal!HalpApcInterrupt)& n- G8 ~' w7 m& p
41: 800650c8 (hal!HalpDispatchInterrupt)
3 d3 j) m: U2 O- C7 H50: 80064190 (hal!HalpApicRebootService). K- U4 ~" L+ n' y4 ^# n% l1 ?! X
51: 817f59e49 ~* V. B9 J3 S$ n
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
V6 @& r4 o( R52: 817f5044
4 b% {" }/ Y- [) f) k! E) r(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
$ q+ d2 D7 A7 Z5 \83: 817d2d44
8 u/ A$ {' C; c2 e0 u! g; @( U) z(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
8 \( W, k( d. H/ O5 _, Y92: 81821384 ( d) X J5 p8 k9 X' R
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
9 @7 O* q* x5 j& v93: 8185ed64
9 A# \; \0 i) X3 w9 ?. U* L% b(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
: H5 f k" j' \) R3 E( xa3: 8186cdc4 6 O; r. }* R( G
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0)); ^; H' R1 l" [8 N( R: N
b1: 818902e4
( ? }8 r# Q* @) h$ J6 ~(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4)). z8 O8 K/ M5 I& w/ u: L. s5 Q7 w
b3: 81881664
( z1 ~ x4 B$ z7 w( d% S! ](Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))/ ?1 c0 u" W8 {- O3 K2 d6 C
c1: 800642fc (hal!HalpBroadcastCallService)
8 C, v1 ?" g H( s& gd1: 80063964 (hal!HalpClockInterrupt)
. c$ T' V* q" Re1: 80064858 (hal!HalpIpiHandler)
" U. X. H) s( C; _+ ~; ^1 @/ we3: 800645d4 (hal!HalpLocalApicErrorService)0 r$ x( P0 f6 Z' `/ o
fd: 80064d64 (hal!HalpProfileInterrupt)$ D& Z, ?1 T5 l# m/ [: V$ n" Y. G6 `$ D/ j
fe: 80064eec (hal!HalpPerfInterrupt)
( y: q/ q8 |2 q( K# s
: z l% s( b6 ~, A- h) i/ S9 ?象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
L7 L& ]+ k3 A0 d9 K6 g3 L5 _' t3 ?9 g5 O
这是几个重要的数组:- V" U- d( z. M) a+ v R) O
2 D1 f C. t; g7 |8 |& b3 p W
HalVectorToIrql(这个数组是以向量除于16做索引):
! G) u T; P; ^7 U" M8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
# X7 B% G% q4 P3 b4 [2 g4 L& [( ^" R+ G9 a y5 b I1 ~
HalpIRQLtoTPR:
" f4 b0 t1 m# D7 j2 j8 }/ B. J8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
% N* D* N) U- B% m/ c8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
+ I3 F* X8 K7 j$ l* p E) b$ }
9 k L& A' v8 x. U' kHalpINTItoVector:" P9 I2 L% ^1 E# |1 r" U( d
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 926 y0 Y# G: ^5 b
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00, a: s0 [8 h7 J( f
4 `$ `0 m" N3 n( ^HalVectorToINTI:7 y7 O1 I( M1 E) S; k( t
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff; w' N/ n( ]. T. t1 k/ V6 j
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff( s7 O; [, s* e
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( M* i' f L! U5 E, E9 ?) k8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff: a2 A, ^, t6 H* ]' z; B
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff, H9 w& P/ Z+ ?; o( f& n
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
& l0 r: {: H# Y8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff( Z' ^; w& B: G/ N1 Z
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
. K" S: X3 c2 ?# G) i) g0 m8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff& Z, K/ T( [4 s( K5 Z
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff, ^1 k# A) n( ^# Z) X4 ^( v' W
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff. T( @3 l. o% i6 k5 g) Q$ R
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
0 d- g& g4 w+ P8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ Z8 G3 S! r4 j# [8 A1 j, ]8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 g4 I- Z$ J6 w1 G4 w9 v$ _8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff. v8 G2 h6 w1 k! y5 y
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 1 N9 |* y: z% \+ Q/ ^
# Q# s. q( F4 J( j# g* I. b
; @( P* }' f: p: y' OvBucket:+ x9 G( H2 H2 W
8006ae30 02 02 02 03 03 03 03" s5 n/ n6 t7 U) Y4 ]
; j, ~3 ~% L' |+ h; |: N 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。* _* r: F1 e) m/ H
6 X, r7 W H( @$ {6 t
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
" `& ]& G( P, M
1 v% _7 l, B* g K8 I, {: y IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
. I5 u+ @( F. u5 V6 [2 w
2 y7 U4 S" V9 K% V6 z$ G 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|