Область действия
Областью действия имени является та часть программы, в которой это имя определено. Для автоматической переменной, описанной в начале функции, областью действия является та функция, в которой описано имя этой переменной, а переменные из разных функций, имеющие одинаковое имя, считаются не от- носящимися друг к другу. Это же справедливо и для аргументов функций. Область действия внешней переменной простирается от точ- ки, в которой она объявлена в исходном файле, до конца этого файла. Например, если VAL, SP, PUSH, POP и CLEAR определены в одном файле в порядке, указанном выше, а именно:
INT SP = 0; DOUBLE VAL[MAXVAL];
DOUBLE PUSH(F) {...}
DOUBLE POP() {...}
CLEAR() {...}
то переменные VAL и SP можно использовать в PUSH, POP и CLEAR прямо по имени; никакие дополнительные описания не нужны. С другой стороны, если нужно сослаться на внешнюю пере- менную до ее определения, или если такая переменная опреде- лена в файле, отличном от того, в котором она используется, то необходимо описание EXTERN.
Важно различать описание внешней переменной и ее опреде- ление. описание указывает свойства переменной /ее тип, раз- мер и т.д./; определение же вызывает еще и отведение памяти. Если вне какой бы то ни было функции появляются строчки
INT SP; DOUBLE VAL[MAXVAL];
то они определяют внешние переменные SP и VAL, вызывают от- ведение памяти для них и служат в качестве описания для ос- тальной части этого исходного файла. В то же время строчки
EXTERN INT SP; EXTERN DOUBLE VAL[];
описывают в остальной части этого исходного файла переменную SP как INT, а VAL как массив типа DOUBLE /размер которого указан в другом месте/, но не создают переменных и не отво- дят им места в памяти. Во всех файлах, составляющих исходную программу, должно содержаться только одно определение внешней переменной; дру- гие файлы могут содержать описания EXTERN для доступа к ней. /Описание EXTERN может иметься и в том файле, где находится определение/. Любая инициализация внешней переменной прово- дится только в определении. В определении должны указываться размеры массивов, а в описании EXTERN этого можно не делать. Хотя подобная организация приведенной выше программы и маловероятна, но VAL и SP могли бы быть определены и инициа- лизированы в одном файле, а функция PUSH, POP и CLEAR опре- делены в другом. В этом случае для связи были бы необходимы следующие определения и описания:
в файле 1: ----------
INT SP = 0; /* STACK POINTER */ DOUBLE VAL[MAXVAL]; /* VALUE STACK */
в файле 2: ----------
EXTERN INT SP; EXTERN DOUBLE VAL[];
DOUBLE PUSH(F) {...}
DOUBLE POP() {...}
CLEAR() {...}
так как описания EXTERN 'в файле 1' находятся выше и вне трех указанных функций, они относятся ко всем ним; одного набора описаний достаточно для всего 'файла 2'.
Для программ большого размера обсуждаемая позже в этой главе возможность включения файлов, #INCLUDE, позволяет иметь во всей программе только одну копию описаний EXTERN и вставлять ее в каждый исходный файл во время его компиляции. Обратимся теперь к функции GETOP, выбирающей из файла ввода следующую операцию или операнд. Основная задача прос- та: пропустить пробелы, знаки табуляции и новые строки. Если следующий символ отличен от цифры и десятичной точки, то возвратить его. В противном случае собрать строку цифр /она может включать десятичную точку/ и возвратить NUMBER как сигнал о том, что выбрано число. Процедура существенно усложняется, если стремиться пра- вильно обрабатывать ситуацию, когда вводимое число оказыва- ется слишком длинным. Функция GETOP считывает цифры подряд /возможно с десятичной точкой/ и запоминает их, пока после- довательность не прерывается. Если при этом не происходит переполнения, то функция возвращает NUMBER и строку цифр. Если же число оказывается слишком длинным, то GETOP отбрасы- вает остальную часть строки из файла ввода, так что пользо- ватель может просто перепечатать эту строку с места ошибки; функция возвращает TOOBIG как сигнал о переполнении.
GETOP(S, LIM) /* GET NEXT OPRERATOR OR OPERAND */ CHAR S[]; INT LIM; { INT I, C;
WHILE((C=GETCH())==' '\!\! C=='\T' \!\! C=='\N') ; IF (C != '.' && (C < '0' \!\! C > '9')) RETURN(C); S[0] = C; FOR(I=1; (C=GETCHAR()) >='0' && C <= '9'; I++) IF (I < LIM)
S[I] = C; IF (C == '.') { /* COLLECT FRACTION */ IF (I < LIM) S[I] = C; FOR(I++;(C=GETCHAR()) >='0' && C<='9';I++) IF (I < LIM) S[I] =C; } IF (I < LIM) { /* NUMBER IS OK */ UNGETCH(C); S[I] = '\0'; RETURN (NUMBER);
} ELSE { /* IT' S TOO BIG; SKIP REST OF LINE */ WHILE (C != '\N' && C != EOF) C = GETCHAR(); S[LIM-1] = '\0'; RETURN (TOOBIG); } }
Что же представляют из себя функции 'GETCH' и 'UNGETCH'? Часто так бывает, что программа, считывающая входные данные, не может определить, что она прочла уже достаточно, пока она не прочтет слишком много. Одним из примеров является выбор символов, составляющих число: пока не появится символ, от- личный от цифры, число не закончено. Но при этом программа считывает один лишний символ, символ, для которого она еще не подготовлена. Эта проблема была бы решена, если бы было бы возможно "прочесть обратно" нежелательный символ. Тогда каждый раз, прочитав лишний символ, программа могла бы поместить его об- ратно в файл ввода таким образом, что остальная часть прог- раммы могла бы вести себя так, словно этот символ никогда не считывался. к счастью, такое неполучение символа легко имми- тировать, написав пару действующих совместно функций. Функ- ция GETCH доставляет следующий символ ввода, подлежащий рас- смотрению; функция UNGETCH помещает символ назад во ввод, так что при следующем обращении к GETCH он будет возвращен. То, как эти функции совместно работают, весьма просто. Функция UNGETCH помещает возвращаемые назад символы в сов- местно используемый буфер, являющийся символьным массивом. Функция GETCH читает из этого буфера, если в нем что-либо имеется; если же буфер пуст, она обращается к GETCHAR. При этом также нужна индексирующая переменная, которая будет фиксировать позицию текущего символа в буфере. Так как буфер и его индекс совместно используются функ- циями GETCH и UNGETCH и должны сохранять свои значения в пе- риод между обращениями, они должны быть внешними для обеих функций. Таким образом, мы можем написать GETCH, UNGETCH и эти переменные как:
#DEFINE BUFSIZE 100 CHAR BUF[BUFSIZE]; /* BUFFER FOR UNGETCH */ INT BUFP = 0; /* NEXT FREE POSITION IN BUF */
GETCH() /* GET A (POSSIBLY PUSHED BACK) CHARACTER */ { RETURN((BUFP > 0) ? BUF[--BUFP] : GETCHAR()); }
UNGETCH(C) /* PUSH CHARACTER BACK ON INPUT */ INT C; { IF (BUFP > BUFSIZE) PRINTF("UNGETCH: TOO MANY CHARACTERS\N"); ELSE BUF [BUFP++] = C; }
Мы использовали для хранения возвращаемых символов массив, а не отдельный символ, потому что такая общность может приго- диться в дальнейшем.
Упражнение 4-4
---------------- Напишите функцию UNGETS(S) , которая будет возвращать во ввод целую строку. Должна ли UNGETS иметь дело с BUF и BUFP или она может просто использовать UNGETCH ?
Упражнение 4-5
---------------- Предположите, что может возвращаться только один символ. Из- мените GETCH и UNGETCH соответствующим образом.
Упражнение 4-6
---------------- Наши функции GETCH и UNGETCH не обеспечивают обработку возв- ращенного символа EOF переносимым образом. Решите, каким свойством должны обладать эти функции, если возвращается EOF, и реализуйте ваши выводы.