Keil C51程序设计中几种精确延时方法

Keil C51程序设计中几种精确延时方法
作者:jdzj868 来源:机电之家下载站录入:jdzj868 更新时间：2009-9-23 15:56:03 点击数：0
【字体：】

摘要实际的单片机应用系统开发过程中，由于程序功能的需要，经常编写各种延时程序，延时时间从数微秒到数秒不等，对于许多C51开发者特别是初学者编制非常精确的延时程序有一定难度。本文从实际应用出发，讨论几种实用的编制精确延时程序和计算程序执行时间的方法，并给出各种方法使用的详细步骤，以便读者能够很好地掌握理解。

关键词 Keil C51 精确延时程序执行时间

引言

单片机因具有体积小、功能强、成本低以及便于实现分布式控制而有非常广泛的应用领域[1]。单片机开发者在编制各种应用程序时经常会遇到实现精确延时的问题，比如按键去抖、数据传输等操作都要在程序中插入一段或几段延时，时间从几十微秒到几秒。有时还要求有很高的精度，如使用单总线芯片DS18B20时，允许误差范围在十几微秒以内[2]，否则，芯片无法工作。用51汇编语言写程序时，这种问题很容易得到解决，而目前开发嵌入式系统软件的主流工具为C语言，用C51写延时程序时需要一些技巧[3]。因此，在多年单片机开发经验的基础上，介绍几种实用的编制精确延时程序和计算程序执行时间的方法。

实现延时通常有两种方法：一种是硬件延时，要用到定时器/计数器，这种方法可以提高CPU的工作效率，也能做到精确延时；另一种是软件延时，这种方法主要采用循环体进行。

1 使用定时器/计数器实现精确延时

单片机系统一般常选用11.059 2 MHz、12 MHz或6 MHz晶振。第一种更容易产生各种标准的波特率，后两种的一个机器周期分别为1 μs和2 μs，便于精确延时。本程序中假设使用频率为12 MHz的晶振。最长的延时时间可达216=65 536 μs。若定时器工作在方式2，则可实现极短时间的精确延时；如使用其他定时方式，则要考虑重装定时初值的时间（重装定时器初值占用2个机器周期）。

在实际应用中，定时常采用中断方式，如进行适当的循环可实现几秒甚至更长时间的延时。使用定时器/计数器延时从程序的执行效率和稳定性两方面考虑都是最佳的方案。但应该注意，C51编写的中断服务程序编译后会自动加上PUSH ACC、PUSH PSW、POP PSW和POP ACC语句，执行时占用了4个机器周期；如程序中还有计数值加1语句，则又会占用1个机器周期。这些语句所消耗的时间在计算定时初值时要考虑进去，从初值中减去以达到最小误差的目的。

2 软件延时与时间计算

在很多情况下，定时器/计数器经常被用

作其他用途，这时候就只能用软件方法延时。下面介绍几种软件延时的方法。

2.1 短暂延时

可以在C文件中通过使用带_NOP_( )语句的函数实现，定义一系列不同的延时函数，如Delay10us( )、Delay25us( )、Delay40us( )等存放在一个自定义的C文件中，需要时在主程序中直接调用。如延时10 μs的延时函数可编写如下：

void Delay10us( ) {
_NOP_( );
_NOP_( );
_NOP_( );
_NOP_( );
_NOP_( );
_NOP_( );
}

Delay10us( )函数中共用了6个_NOP_( )语句，每个语句执行时间为1 μs。主函数调用Delay10us( )时，先执行一个LCALL指令（2 μs），然后执行6个_NOP_( )语句（6 μs），最后执行了一个RET指令（2 μs），所以执行上述函数时共需要10 μs。可以把这一函数当作基本延时函数，在其他函数中调用，即嵌套调用\[4\]，以实现较长时间的延时；但需要注意，如在Delay40us( )中直接调用4次Delay10us( )函数，得到的延时时间将是42 μs，而不是40 μs。这是因为执行Delay40us( )时，先执行了一次LCALL指令（2 μs），然后开始执行第一个Delay10us( )，执行完最后一个Delay10us( )时，直接返回到主程序。依此类推，如果是两层嵌套调用，如在Delay80us( )中两次调用Delay40us( )，则也要先执行一次LCALL指令（2 μs），然后执行两次Delay40us( )函数（84 μs），所以，实际延时时间为86 μs。简言之，只有最内层的函数执行RET指令。该指令直接返回到上级函数或主函数。如在Delay80μs( )中直接调用8次Delay10us( )，此时的延时时间为82 μs。通过修改基本延时函数和适当的组合调用，上述方法可以实现不同时间的延时。

2.2 在C51中嵌套汇编程序段实现延时

在C51中通过预处理指令#pragma asm和#pragma endasm可以嵌套汇编语言语句。用户编写的汇编语言紧跟在#pragma asm之后，在#pragma endasm之前结束。

如：#pragma asm
…
汇编语言程序段
…
#pragma endasm

延时函数可设置入口参数，可将参数定义为unsigned char、int或long型。根据参数与返回值的传递规则，这时参数和函数返回值位于R7、R7R6、R7R6R5中。在应用时应注意以下几点：

◆ #pragma asm、#pragma endasm不允许嵌套使用；
◆ 在程序的开头应加上预处理指令#pragma asm，在该指令之前只能有注释或其他预处理指令；
◆ 当使用asm语句时，编译系统并不输出目标模块，而只输出汇编源文件；
◆ asm只能用小写字母，如果把asm写成大写，编译系统就把它作为普通变量；
◆ #pragma asm、#pragma endasm和 asm只能在函数内使用。

将汇编语言与C51结合起来，

充分发挥各自的优势，无疑是单片机开发人员的最佳选择。

2.3 使用示波器确定延时时间

熟悉硬件的开发人员，也可以利用示波器来测定延时程序执行时间。方法如下：编写一个实现延时的函数，在该函数的开始置某个I/O口线如P1.0为高电平，在函数的最后清P1.0为低电平。在主程序中循环调用该延时函数，通过示波器测量P1.0引脚上的高电平时间即可确定延时函数的执行时间。方法如下：

sbit T_point = P1^0;
void Dly1ms(void) {
unsigned int i,j;
while (1) {
T_point = 1;
for(i=0;i<2;i++){
for(j=0;j<124;j++){;}
}
T_point = 0;
for(i=0;i<1;i++){
for(j=0;j<124;j++){;}
}
}
}
void main (void) {
Dly1ms();
}

把P1.0接入示波器，运行上面的程序，可以看到P1.0输出的波形为周期是3 ms的方波。其中，高电平为2 ms，低电平为1 ms，即for循环结构“for(j=0;j<124;j++) {;}”的执行时间为1 ms。通过改变循环次数，可得到不同时间的延时。当然，也可以不用for循环而用别的语句实现延时。这里讨论的只是确定延时的方法。

2.4 使用反汇编工具计算延时时间

对于不熟悉示波器的开发人员可用Keil C51中的反汇编工具计算延时时间，在反汇编窗口中可用源程序和汇编程序的混合代码或汇编代码显示目标应用程序。为了说明这种方法，还使用“for (i=0;i
C:0x000FE4CLRA//1T
C:0x0010FEMOVR6,A//1T
C:0x0011EEMOVA,R6//1T
C:0x0012C3CLRC//1T
C:0x00139FSUBBA,DlyT //1T
C:0x00145003JNCC:0019//2T
C:0x00160E INCR6//1T
C:0x001780F8SJMPC:0011//2T

可以看出，0x000F～0x0017一共8条语句，分析语句可以发现并不是每条语句都执行DlyT次。核心循环只有0x0011~0x0017共6条语句，总共8个机器周期，第1次循环先执行“CLR A”和“MOV R6，A”两条语句，需要2个机器周期，每循环1次需要8个机器周期，但最后1次循环需要5个机器周期。DlyT次核心循环语句消耗（2+DlyT×8+5）个机器周期，当系统采用12 MHz时，精度为7 μs。

当采用while (DlyT--)循环体时，DlyT的值存放在R7中。相对应的汇编代码如下：

C:0x000FAE07MOVR6, R7//1T
C:0x00111F DECR7//1T
C:0x0012EE MOVA,R6//1T
C:0x001370FAJNZC:000F//2T

循环语句执行的时间为（DlyT+1）×5个机器周期，即

这种循环结构的延时精度为5 μs。

通过实验发现，如将while (DlyT--)改为while (--DlyT)，经过反汇编后得到如下代码：

C:0x0014DFFE DJNZR7,C:0014//2T

可以看出，这时代码只有1句，共占用2个机器周期，精度达到2 μs，循环体耗时DlyT×2个机器周期；但这时应该注意，DlyT初始值不能为0。

这3种循环结构的延时与循环次数的关系如表1所列。

表1 循环次数与延时时间关系单位：μs

注意：计算时间时还应加上函数调用和函数返回各2个机器周期时间。

2.5 使用性能分析器计算延时时间

很多C程序员可能对汇编语言不太熟悉，特别是每个指令执行的时间是很难记忆的，因此，再给出一种使用Keil C51的性能分析器计算延时时间的方法。这里还以前面介绍的for (i=0;i<124;i++)结构为例。使用这种方法时，必须先设置系统所用的晶振频率，选择Options for target中的target选项，在Xtal(MHz)中填入所用晶振的频率。将程序编译后，分别在_point = 1和T_point = 0处设置两个运行断点。选择start/stop debug session按钮进入程序调试窗口，分别打开Performance Analyzer window和Disassembly window。运行程序前，要首先将程序复位，计时器清零；然后按F5键运行程序，从程序效率评估窗口的下部分可以看到程序到了第一个断点，也就是所要算的程序段的开始处，用了389 μs；再按F5键，程序到了第2个断点处也就是所要算的程序段的结束处，此时时间为1 386 μs。最后用结束处的时间减去开始处时间，就得到循环程序段所占用的时间为997 μs。

当然也可以不用打开Performance Analyzer window，这时观察左边工具栏秒（SEC）项。全速运行时，时间不变，只有当程序运行到断点处，才显示运行所用的时间。

3 总结

本文介绍了多种实现并计算延时程序执行时间的方法。使用定时器进行延时是最佳的选择，可以提高MCU工作效率，在无法使用定时器而又需要实现比较精确的延时时，后面介绍的几种方法可以实现不等时间的延时：使用自定义头文件的优点是，可实现任意时间长短的延时，并减少主程序的代码长度，便于对程序的阅读理解和维护。编写延时程序是一项很麻烦的任务，可能需要多次修改才能满足要求。掌握延时程序的编写，能够使程序准确得以执行，这对项目开发有着重要的意义。本文所讨论的几种方法，都是来源于实际项目的开发经验，有着很好的实用性和适应性。

参考文献
C51精确延时，绝对精确！
发布: 2010-1-10 14:25 | 作者: cat_li | 来源: 电子爱好者社区

转自：https://www.360docs.net/doc/4312680832.html,/bbs/bbs_con ... 298&bbs_id=9999
有些特殊的应用会用到比较精确的延时

（比如DS18B20等），而C不像汇编，延时精准度不好算。本人经过反复调试，对照KEIL编译后的汇编源文件，得出了以下几条精确延时的语句（绝对精确！本人已通过实际测试），今天贴上来，希望对需要的朋友有所帮助。

sbit LED = P1^0; // 定义一个管脚(延时测试用)
unsigned int i = 3; // 注意i,j的数据类型，
unsigned char j = 3; // 不同的数据类型延时有很大不同
//-----------------各种精确延时语句-----------------------------------
while( (i--)!=1 ); // 延时10*i个机器周期
i = 10; while( --i ); // 延时8*i+2个机器周期
i = 10; while( i-- ); // 延时(i+1)*9+2个机器周期
j = 5; while( --j ); // 延时2*j+1个机器周期
j = 5; while( j-- ); // 延时(j+1)*6+1个机器周期

i = 5;
while( --i ) // 延时i*10+2个机器周期，在i*10+2个机器周期
if( LED==0 ) break; // 内检测到LED管脚为低电平时跳出延时

i = 5;
while( LED ) // 每隔10个机器周期检测一次LED管脚状态，当LED
if( (--i)==0 ) break;// 为低时或者到了10*i+2个机器周期时跳出延时
//--------------------------------------------------------------------

例如18b20的复位函数（12M晶振）:
//***********************************************************************
// 函数功能：18B20复位
// 入口参数：无
// 出口参数：unsigned char x： 0：成功 1：失败
//***********************************************************************
unsigned char ow_reset(void)
{
unsigned char x="0"; // 12M晶振 1个机器周期为1us
DQ = 1; // DQ复位
j = 10; while(--j);// 稍做延时(延时10*2+1=21个机器周期，21us)
DQ = 0; // 单片机将DQ拉低
j = 85; while(j--);// 精确延时(大于480us) 85*6+1=511us
DQ = 1; // 拉高总线
j = 10; while(j--);// 精确延时10*6+1=61us
x = DQ; // 稍做延时后,
return x; // 如果x=0则初始化成功 x="1则初始化失败"
j = 25; while(j--);// 精确延时25*6+1=151us
}
//*********************************************************************************
再如红外解码程序：
（先说传统红外解码的弊端：
程序中用了while(IR_IO);while(!IR_IO);这样的死循环，如果管脚一直处于一种状态，就会一直执行while，造成“死机”现象。当然这种情况很少，但我们也的考虑到。而用以下程序则不会，在规定的时间内没有正确的电平信号就会返回主程序，这样就不会出现“死机”了）
//***************************外部中断0*******************************
void int0(void) interrupt 0
{
unsigned char i,j;
unsigned int count = 800;
//--------------8.5ms低电平引导码-------------------------------------
while( --count )
if( IR_IO==1 ) return; // 在小于8ms内出现高电平，返回
count = 100;

// 延时1ms
while( !IR_IO ) // 等待高电平
if( (--count)==0 ) return; // 在9ms内未出现高电平,返回
//-------------4.5ms高电平引导码------------------------------------
count = 410; // 延时4.1ms
while( --count ) // ...
if( IR_IO==0 ) return; // 在4.1ms内出现低电平，返回
count = 50; // 延时0.5ms
while( IR_IO ) // 等待低电平
if( (--count)==0 ) return; // 在4.7ms内未出现低电平，返回
//-----------------------------------------------------------------
//------------4个数据码------------------------------------
for( j="0";j<4;j++ )
{
for( i="0";i<8;i++ )
{
IR_data[j] <<= 1; // 装入数据
count = 60; // 延时0.6ms
while( !IR_IO ) // 等待高电平
if( (--count)==0 ) return; // 在0.6ms内未出现高电平，返回
count = 40; // 低电平结束，继续
while( --count ) // 延时0.4ms
if( IR_IO==0 ) return; // 在0.4ms内出现低电平，返回
count = 100; // 延时1.4ms
while( IR_IO ) // 检测IO状态
if( (--count)==0 ) // 等待1.4ms到来
{ // 在1.4ms内都是高电平
IR_data[j] |= 1; // 两个单位高电平,为数据1
break; // 跳出循环
}
count = 20; // 延时0.2ms
while( IR_IO ) // 等待低电平跳出
if( (--count)==0 ) return; // 0.2ms内未出现低电平，返回
}
}
//-------------------------------------------------------------------
flag_IR = 1; // 置位红外接收成功标志
}

C51精确延时程序设计实例【进入博客】【进入论坛】更新时间：2009年07月15日浏览次数： 155 作者：来源：一个处理的很经典的延时程序
有个好帖，从精度考虑，它得研究结果是：
void delay2(unsigned char i)
{
while(--i);
}
为最佳方法。

分析：假设外挂12M（之后都是在这基础上讨论）
我编译了下，传了些参数，并看了汇编代码，观察记录了下面的数据：
delay2(0):延时518us 518-2*256=6
delay2(1):延时7us（原帖写“5us”是错的，^_^）
delay2(10):延时25us 25-20=5
delay2(20):延时45us 45-40=5
delay2(100):延时205us 205-200=5
delay2(200):延时405us 405-400=5

见上可得可调度为2us，而最大误差为6us。
精度是很高了！

但这个程序的最大延时是为518us 显然不
能满足实际需要，因为很多时候需要延迟比较长的时间。

那么，接下来讨论将t分配为两个字节，即uint型的时候，会出现什么情况。

void delay8(uint t)
{
while(--t);
}
我编译了下，传了

些参数，并看了汇编代码，观察记录了下面的数据：
delay8(0):延时524551us 524551-8*65536=263
delay8(1):延时15us
delay8(10):延时85us 85-80=5
delay8(100):延时806us 806-800=6
delay8(1000):延时8009us 8009-8000=9
delay8(10000):延时80045us 80045-8000=45
delay8(65535):延时524542us 524542-524280=262

如果把这个程序的可调度看为8us，那么最大误差为263us，但这个延时程序还是不能满足要求的，因为延时最大为524.551ms。

那么用ulong t呢？
一定很恐怖，不用看编译后的汇编代码了。。。

那么如何得到比较小的可调度，可调范围大，并占用比较少得RAM呢？请看下面的程序：

/*--------------------------------------------------------------------
程序名称：50us 延时
注意事项：基于1MIPS，AT89系列对应12M晶振，W77、W78系列对应3M晶振
例子提示：调用delay_50us（20），得到1ms延时
全局变量：无
返回：无
--------------------------------------------------------------------*/
void delay_50us(uint t)
{
uchar j;
for(;t>0;t--)
for(j=19;j>0;j--)
;
}

我编译了下，传了些参数，并看了汇编代码，观察记录了下面的数据：
delay_50us(1):延时63us 63-50=13
delay_50us(10):延时513us 503-500=13
delay_50us(100):延时5013us 5013-5000=13
delay_50us(1000):延时50022us 50022-50000=22

赫赫，延时50ms，误差仅仅22us，作为C语言已经是可以接受了。再说要求再精确的话，就算是用汇编也得改用定时器了。

/*--------------------------------------------------------------------
程序名称：50ms 延时
注意事项：基于1MIPS，AT89系列对应12M晶振，W77、W78系列对应3M晶振
例子提示：调用delay_50ms（20），得到1s延时
全局变量：无
返回：无
--------------------------------------------------------------------*/
void delay_50ms(uint t)
{
uint j;
/****
可以在此加少许延时补偿，以祢补大数值传递时（如delay_50ms(1000)）造成的误差，
但付出的代价是造成传递小数值（delay_50ms(1)）造成更大的误差。
因为实际应用更多时候是传递小数值，所以补建议加补偿！
****/
for(;t>0;t--)
for(j=6245;j>0;j--)
;
}
我编译了下，传了些参数，并看了汇编代码，观察记录了下面的数据：
delay_50ms(1):延时50 010 10us
delay_50ms(10):延时499 983 17us
delay_50ms(100):延时4 999 713 287us
delay_50ms(1000):延时4 997 022 2.978ms

赫赫，延时50s，误差仅仅2.978ms，可以接受！

上面程序没有才用long，也没采用3层以上的循环，而是将延时分拆为两个程序以提高精度。应该是比较好的做法了。