找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 32782|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
3 G1 i1 Y) w/ @- Z: v" n2 O% I
  • Phenomenon. |* v4 p3 z5 ?, W, v
- |7 @  i0 k& Y. E* s6 ]
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

( w  p  k8 O. k' F9 Z: [. Q
1
  • Why???9 [8 y* D# P  A% S% Q: x5 c7 g4 z
2 j, W( A) u) D( s  g
! O# e' ^) J# B4 U
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
, k+ i4 C$ ~! q- ]- T4 d
// AC Change event6 O: ^: I% d# x0 j
# j/ o: c6 z* S6 a
Method(_QXX)

3 J/ T- o$ V, u( G% |- `3 Z5 @: e3 l9 c" r- d+ U1 I
{

3 j4 J, Y6 H3 {* ]4 D; @4 h/ o+ P# I4 ], ^2 y2 s! ^/ C. y
Store(0x09, DBG8)
* ?4 z: H# s* `5 O9 e) ~$ A
6 ]8 E5 Q. e" F% J
Notify(\_SB. ADP,0x80)
9 ~- L; W3 `( g* v//Power Source status changed
8 \& u! `2 t8 P9 Z' ?

' s0 B& Y4 u* c" Y) ]' cStore(0x0A, DBG8)

: D# L) P1 h2 u, q
1 t1 H# s9 ?0 g5 x4 J: Q+ \( Q6 d, ]9 I) T0 i* c/ F! x" }4 t
}
9 Q+ b# s* \, |! w/ R6 }. K+ v' e

4 O# Q0 \4 S% u
* F% ~$ W3 S; R1 j9 ?
& `. G3 U6 J$ Z1 y. Z8 v
Method(_PSR,0)
6 {+ ^( \. t2 J+ d+ K; c! W
- e' z3 U% [0 f- g5 W
( F4 A4 |& N3 }% u+ x
{0 N/ T% E! n! }4 `/ c) _

3 _  l1 I9 W( z1 m9 B7 |( K* a$ u4 H# `# x3 p9 [/ n
Store(0x0B, DBG8)+ H3 L1 X4 J2 x) ~' f
  ~2 ]/ F( L2 G3 b3 A+ _2 b
0 @, u3 B/ M9 `
If(ACST)
9 z" ?/ y' G6 L4 }//check AC status

9 z4 A. u6 V( Y, [1 _7 |' r% k" f, E/ m$ ]! Z/ `3 n" f
{
. [2 @* k  @  t% n

, Y/ i: q/ J. _5 K. I3 p/ j( o, i8 H5 j8 F5 s, h
return(One)3 W: H, }8 e* F6 [
// AC Present

1 q4 L+ B/ j- y7 T/ m
' q/ a; W7 r. x& R}

) o" {' @' F8 q& {+ J1 G* F9 n  D! q
9 o- E# h. H2 @8 Selse
- \- d( @* Z+ O5 N+ r( `
3 D8 d0 W: f8 f0 A
{
) l/ |8 A9 h8 @! W& v2 E) d& _6 ?
$ G7 e, C+ N% M. E
return(Zero)  `: m4 \, S+ j$ I7 M
// AC Not Present
; h( @6 R: a. k

, I8 r; O& Y7 s  X  \+ ~}
6 R# e: |- W% m8 n" ?6 i

0 K% p8 Y  Y6 Y0 J2 Q9 B; V6 _6 ]Store(0x0C, DBG8)

; |& }) a3 [# L' s0 ]+ B$ q2 Q1 W0 d: u9 P
}# w- i4 F' G( x( z8 ~

0 Y5 l. I1 ]) l( s
, J* h- i& b8 [) C' C* h
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。7 `# m9 T) d; q% m5 Z4 y
状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:1 n) h/ o; l, h; @3 }7 m* E7 \! F
Method(_BST)! f0 X0 g! c4 S2 T5 p' k
{. g9 w) \9 E. j; V* b  r

8 d! y# z! v) [0 bStore(BSTS,Local0)

  U1 h: |: A& `2 C& k- s- m
: ?0 E, g' G, w' Q3 U3 U  u& i: Z2 v2 b  L
If(LEqual(Local0,1)) //Check Battery Present Bit
' {' [1 I7 v$ R# I8 \6 B

8 a5 L" L5 f) A) `& D{
8 d- ]/ D1 A5 K0 n: W1 _/ K+ u, d" z' z2 g* }- z- f

# [7 k( Y' |  d4 h/ d, a7 Z2 X0 P; Z2 v. }2 j; a' g3 M  O$ O
* ?* z: r& C/ m# O9 K

( F5 m$ L+ D7 m//Read Battery information from EC
3 f( c5 c) I- }
; p& {% M: a9 [; w
… …
: [& m- U  N7 F& a/ D

5 k$ y" L6 W7 B; ^% M
; o+ E8 D, }" z6 s}
0 H' z5 }, o# I8 b' L! k/ O. t; u

) J1 s! }3 _! k! _8 B. _Store(0x0D, DBG8)
& v' f- @  i# {2 ?* n
}
0 L6 ^+ I$ X# x. ]那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。: ~+ I/ d* ^6 G7 R+ r# D# }
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

) {! S5 @6 N9 W  D. T* B3 ]) ?5 |* d  g6 J& d% G) c7 n9 m4 i
5 ^& B$ E9 J( M7 ]5 s. v0 v
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.7 }4 }0 A+ Z& w$ O

2 v3 f. `$ C4 Z- h5 V" h  \
  • Solution
, L3 l9 q0 J# k: }6 F

+ _/ L! h/ e/ M2 F/ ~& B% _经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!0 Y4 A1 g5 f- b

2 I6 B3 T" _% j, I/ d1 K, p! Y9 V! x* s. a5 f2 u- C" h

$ a) |: [, [6 X# i; P * d. S( \1 i0 c' ~3 c6 S/ l* ?  b
That’s all!
" S5 Z* T2 @* J, P9 C & E. e( z, N+ [1 t
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
% o  R/ q% P  \9 n3 y8 |( C3 U5 O( Y! Z5 K( V/ ~
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
$ i. _5 ^4 @" |( H9 O我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...
6 k* |3 L. Z  j' B6 Y5 B很高心这篇文章能够对你有帮助。& d/ n2 |% w9 f/ o& ^1 }
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
: A% `4 Q  q8 aACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
5 ]- p& y' n4 z' `2 k( n: e简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
, d' Q# t# o+ w& {/ ]0 I: T7 ~对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
5 U# H. T# c6 X; e9 \# X7 B5 {/ \; s
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
% {- y  \$ q$ L2 O! m  z; Y呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!0 i. E* u" @! q1 L# V
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:9 \! ^. h0 l" F8 Z( u
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock. j, O- T8 ^2 O- Z- d
chipset reset pci reset系统重启。
, E: Q& e8 w& m3 T! m: K0 q1 f2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)/ j7 O( e1 y, [9 J; [
等等一些琐碎的动作。. S, j& ?* m% `( F1 R. K
之前碰到问题比较多的地方就在idle这部分了。% n; t& I7 s" R
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...& {  K7 |2 o) a/ [
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。
- p2 c- H+ @( T: C! ]/ y& f以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
8 Z) b' G( h+ p' O: p4 H    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
* {2 y* E4 H/ I. ]     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:% x# K: d  L4 \6 F9 `
BIOS发FE不是通过SCI,而是透过60h,64h port。
7 z1 B% c$ H" J1 l& R% e0 M4 l6 A9 t$ VBIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-4-29 05:59 , Processed in 0.046420 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表