Использование макроса SAS для передачи списка имен файлов из каталога Windows

Я пытаюсь изменить приведенный ниже макрос, чтобы принять параметр макроса в качестве аргумента «местоположение» для команды dir. Однако я не могу заставить его правильно решить из-за проблемы с вложенными кавычками. Использование %str(%') не работает, как и функции цитирования по какой-то причине.

Макрос будет работать нормально, если в пути к файлу нет пробелов (например, C:\temp\withnospace), так как средние кавычки не нужны. Однако мне нужно, чтобы этот макрос работал для путей к файлам с пробелами (например, 'C:\temp\с пробелом\').

Пожалуйста помоги!

%macro get_filenames(location)
   filename pipedir pipe   "dir &location. /b " lrecl=32767;
   data filenames;
     infile pipedir truncover;
     input line $char1000.;
   run;
%mend;

%get_filenames(C:\temp\)              /* works */
%get_filenames('C:\temp\with space')  /* doesnt work */

person Allan Bowe    schedule 11.09.2009    source источник


Ответы (8)


Вот еще один способ добиться того же результата без использования PIPE.

%macro get_filenames(location);
filename _dir_ "%bquote(&location.)";
data filenames(keep=memname);
  handle=dopen( '_dir_' );
  if handle > 0 then do;
    count=dnum(handle);
    do i=1 to count;
      memname=dread(handle,i);
      output filenames;
    end;
  end;
  rc=dclose(handle);
run;
filename _dir_ clear;
%mend;

%get_filenames(C:\temp\);           
%get_filenames(C:\temp\with space);
%get_filenames(%bquote(C:\temp\with'singlequote));
person cmjohns    schedule 11.09.2009
comment
хотя на самом деле это не отвечает на вопрос, этот код намного лучше, поскольку его можно использовать в разных средах, и он выполняет ту же цель. Спасибо... - person Allan Bowe; 14.09.2009

Внесите следующие несколько изменений, и ваш код заработает.

%macro get_filenames(location);  %*--(1)--*;
   filename pipedir pipe "dir ""%unquote(&location)"" /b" lrecl=32767; %*--(2)--*;
   data filenames;
     infile pipedir truncover;
     input filename $char1000.;
     put filename=;
   run;
   filename pipedir clear;  %*--(3)--*;
%mend;

%get_filenames(d:\)          
%get_filenames(d:\your dir)  %*--(4)--*;

(1) Завершите оператор %macro точкой с запятой;

(2) Окружите разрешение макропеременной двойными двойными кавычками и %unquote;

(3) Освободите дескриптор файла, очистив его; а также

(4) Не заключайте входной параметр в одинарные кавычки. вместо этого макрос цитаты, если это необходимо.

person Chang Chung    schedule 11.09.2009
comment
это работает, но оставляет сообщение об ошибке (ВНИМАНИЕ: нет логического назначения для имени файла PIPE.) - person Allan Bowe; 14.09.2009
comment
просто измените канал имени файла; очистить имя файла pipedir; чтобы подавить предупреждение. - person cmjohns; 14.09.2009

На основе последнего примера на этой страницы вместо оператора имени файла попробуйте

%let filrf=pipedir;
%let rc=%sysfunc(filename(filrf,%bquote(dir "&location" /b),pipe));

и вызовите макрос без использования кавычек:

%get_filenames(c:\temp\with spaces);

Я также пробовал цитировать макросы, но не смог заставить его работать.

person Ville Koskinen    schedule 11.09.2009
comment
+1 - красиво. Вы также можете передать lrecl в качестве параметра хоста, чтобы он был таким же, как его оригинал: %let rc=%sysfunc(filename(filrf,%bquote(dir &location /b),pipe, lrecl=32767)); - person cmjohns; 11.09.2009

вот быстрый макрос для извлечения списков каталогов на основе Windows в набор данных sas.

%macro DirList(dir);

/* %if &SUBDIR eq %then %let subdir=/s; */        /*** &SUBDIR not defined ****/
filename dirpipe pipe "dir &DIR.\*.* /s /-c";

data dir_list(label="Directory Listing [&DIR.]" drop=re_: _line_ date time);
  format Path
         File   $250.
         ModDT  datetime19.
         Size   16.
         _line_ $32000. ;

  if _N_ = 1 then do;
    re_path=prxparse("/Directory of (.+)/");
    re_subd=prxparse("/(\d\d\/\d\d\/\d\d\d\d)\s+(\d\d:\d\d [A|P]M)\s+\s+(\S.*)/");
    re_file=prxparse("/(\d\d\/\d\d\/\d\d\d\d)\s+(\d\d:\d\d [A|P]M)\s+(\d+)\s+(\S.*)/");
    retain re_: path;
    end;

  infile dirpipe lrecl=32000; input; _line_ = _infile_;

  if lengthn(_line_)=0 then delete;
  else
  if prxmatch(re_path, _line_) then do;
    path=prxposn(re_path, 1, _line_);
    end;
  else
  if prxmatch(re_subd, _line_) then do;
    date=input(prxposn(re_subd, 1, _line_), mmddyy10.);
    time=input(prxposn(re_subd, 2, _line_), time6.);
    ModDT=dhms(date, 0, 0, time);
    File=prxposn(re_subd, 3, _line_);
    size = .D; /*mark subdirectory records*/
    if file not in ('.', '..') then output;
    end;
  else
  if prxmatch(re_file, _line_) then do;
    date=input(prxposn(re_file, 1, _line_), mmddyy10.);
    time=input(prxposn(re_file, 2, _line_), time6.);
    ModDT=dhms(date, 0, 0, time);
    size=input(prxposn(re_file, 3, _line_), 16.);
    file=prxposn(re_file, 4, _line_);
    output;
    end;
run;
filename dirpipe clear;
%mend;

и вот как они называются

%dirlist(c:);
%dirlist(c:\temp);

обратите внимание, что при указании базового каталога нет обратной косой черты. C: не C:\.

person rkoopmann    schedule 14.09.2009
comment
Мне это нравится, но мне пришлось внести пару изменений, чтобы оно заработало в моей системе (win xp). Я изменил строку re_subd= на re_subd=prxparse(/(\d\d\/\d\d\/\d\d\d\d)\s+(\d\d:\d\d [A|P ]M)\s+‹DIR›\s+(\S.*)/); так как в противном случае каждая строка рассматривалась для меня как поддиректория. Кроме того, я удалил %if &SUBDIR eq %then %let subdir=/s; строка, поскольку макропеременная &subdir не определена и больше нигде не используется. - person cmjohns; 15.09.2009
comment
Я помню, что мне пришлось внести изменения в шаблон регулярного выражения re_subd при обновлении ОС, но я никогда не думал о сохранении предыдущей версии. параметр SUBDIR предназначен для указания переключателя /s для рекурсивных списков подкаталогов. когда-нибудь. - person rkoopmann; 15.09.2009

у меня работает, если я вызываю исходный макрос таким образом

%get_filenames(""C:\Program Files"")

конечно, мне пришлось добавить точку с запятой в конце оператора %macro.

if your directory contains a comma, bad things happen. to fix, use the %str() macro

 %get_filenames(%str(C:\temp\comma, fail)) 

person rkoopmann    schedule 11.09.2009

Вот чистая версия кода макроса. Это также позволяет вам указать, что вы хотите знать только о файлах (а не о папках), и позволяет указать базовый фильтр. Он возвращает список файлов в формате с разделителями, но вы можете легко вставить их в набор данных, используя вставку SQL, если хотите (пример включен, но не проверен - без доступа к SAS). Его можно вызвать из любого места — из другого макроса, набора данных, оператора sql... где угодно. Просто добавьте эти два макроса в свою библиотеку автовызова макросов, и все готово.

Ниже 2 макроса. Макрос %isdir требуется для макроса %file_list. Макросы немного больше и сложнее, чем выше, но они НАМНОГО более гибкие. Кроме того, они обеспечивают проверку ошибок.

/******************************************************************************
** PROGRAM:  ISDIR.SAS
**
** DESCRIPTION: DETERMINES IF THE SPECIFIED PATH EXISTS OR NOT.
**              RETURNS: 0 IF THE PATH DOES NOT EXIST OR COULD NOT BE OPENED.
**                       1 IF THE PATH EXISTS AND CAN BE OPENED.
**
** PARAMETERS: iPath: THE FULL PATH TO EXAMINE.  NOTE THAT / AND \ ARE TREATED
**                    THE SAME SO &SASDIR/COMMON/MACROS IS THE SAME AS
**                    &SASDIR\COMMON\MACROS.
**
******************************************************************************/

%macro isDir(iPath=,iQuiet=1);
  %local result dname;

  %let result = 0;

  %if %sysfunc(filename(dname,&iPath)) eq 0 %then %do;
    %if %sysfunc(dopen(&dname)) %then %do;
      %let result = 1;
    %end;
    %else %if not &iQuiet %then %do;
      %put ERROR: ISDIR: %sysfunc(sysmsg());
    %end;
  %end;
  %else %if not &iQuiet %then %do;
    %put ERROR: ISDIR: %sysfunc(sysmsg());
  %end;

  &result

%mend;

%put %isDir(iPath=&sasdir/common/macros);
%put %isDir(iPath=&sasdir/kxjfdkebnefe);
%put %isDir(iPath=&sasdir/kxjfdkebnefe, iQuiet=0);
%put %isDir(iPath=c:\temp);

/******************************************************************************
** PROGRAM:  FILE_LIST.SAS
**
** DESCRIPTION: RETURNS THE LIST OF FILES IN A DIRECTORY SEPERATED BY THE
**              SPECIFIED DELIMITER. RETURNS AN EMPTY STRING IF THE THE 
**              DIRECTORY CAN'T BE READ OR DOES NOT EXIST.
**
** PARAMETERS: iPath      : THE FULL PATH TO EXAMINE.  NOTE THAT / AND \ ARE 
**                          TREATED THE SAME SO &SASDIR/COMMON/MACROS IS THE 
**                          SAME AS &SASDIR\COMMON\MACROS. WORKS WITH BOTH UNIX 
**                          AND WINDOWS.
**             iFilter    : SPECIFY A BASIC FILTER TO THE FILENAMES, NO REGULAR 
**                          EXPRESSIONS OR WILDCARDS.
**             iFiles_only: 0=RETURN FILES AND FOLDERS
**                          1=RETURN FILES ONLY.
**             iDelimiter : SPECIFY THE DELIMITER TO SEPERATE THE RESULTS BY.
******************************************************************************/
/*
** TODO: DOESNT CATER FOR MACRO CHARS IN FILENAMES. FIX SOMETIME.
** TODO: IMPROVE THE FILTER. JUST A SIMPLE IF STATEMENT AT THE MOMENT.
*/
%macro file_list(iPath=, iFilter=, iFiles_only=0, iDelimiter=|);
  %local result did dname cnt num_members filename;

  %let result=;

  %if %sysfunc(filename(dname,&iPath)) eq 0 %then %do;

    %let did = %sysfunc(dopen(&dname));
    %let num_members = %sysfunc(dnum(&did));

    %do cnt=1 %to &num_members;
      %let filename = %sysfunc(dread(&did,&cnt));
      %if "&filename" ne "" %then %do;
        %if &iFiles_only %then %do;
          %if not %isDir(iPath=&iPath/&filename) %then %do;
            %if "&iFilter" ne "" %then %do;
              %if %index(%lowcase(&filename),%lowcase(&iFilter)) %then %do;
                %let result = &result%str(&iDelimiter)&filename;
              %end;
            %end;
            %else %do;
              %let result = &result%str(&iDelimiter)&filename;
            %end;
          %end;
        %end;
        %else %do;
          %if "&iFilter" ne "" %then %do;
            %if %index(%lowcase(&filename),%lowcase(&iFilter)) %then %do;
              %let result = &result%str(&iDelimiter)&filename;
            %end;
          %end;
          %else %do;
            %let result = &result%str(&iDelimiter)&filename;
          %end;
        %end;
      %end;
      %else %do;
        %put ERROR: (CMN_MAC.FILE_LIST) FILE CANNOT BE READ.;
        %put %sysfunc(sysmsg());
      %end;
    %end;

  %end;
  %else %do;
    %put ERROR: (CMN_MAC.FILE_LIST) PATH DOES NOT EXIST OR CANNOT BE OPENED.;
    %put %sysfunc(sysmsg());
  %end;

  /*
  ** RETURN THE RESULT.  TRIM THE LEADING DELIMITER OFF THE FRONT OF THE RESULTS.
  */
  %if "&result" ne "" %then %do;
    %substr(&result,2)
  %end;

%mend; 



**
** EXAMPLES - HAVENT TESTED THE LAST TWO YET BUT THEY SHOULD WORK IF SYNTAX IS CORRECT
*;

%put %file_list(iPath=c:\temp);

%put %file_list(iPath=c:\xxdffsds);

%put %file_list(iPath=c:\rob\SASDev\, iFilter=a);

%put %file_list(iPath=c:\rob\SASDev\,iFiles_only=1);

%put %file_list(iPath=/tmp/unix_sasdir,iFiles_only=1);

data x;
  file_list = "%file_list(iPath=c:\temp)";
run;

proc sql noprint;
  insert into my_table values ("%file_list(iPath=c:\temp,iDelimiter=%str(","))");
quit;
person Robert Penridge    schedule 18.04.2010

Вот тот, который расшифровывает порядок цитирования и раскавычивания:

%let command =%unquote(%str(%')dir "&baseDir.data\*txt"%str(%'));

filename datain pipe &command;

где макропеременная baseir может содержать пробелы, как и имена файлов. Эта комбинация %unquote и %str(%') является часто встречающейся макроидиомой.

"что, если у меня есть одинарная кавычка в моем каталоге?"

Для обработки этой ситуации требуется функция цитирования макроса, такая как %bquote(); Продолжая пример выше, это:

%let command =%unquote(%str(%')dir "%bquote(&baseDir.data\*txt)"%str(%'));

должен сделать это.

Чтобы избежать бесконечных итераций такого рода вопросов, просмотрите статью Яна Уитлока «Серьезный взгляд на цитирование макросов», которая доступна здесь;

Есть (много) других, но это наиболее часто цитируемое. Небольшое примечание: что-нибудь Яна Уитлока, вероятно, стоит того. Он пишет ясно, и его понимание проблем SAS потрясающе.

person Jonathan Goldberg    schedule 15.03.2010

Мы используем этот маленький макрос

%macro getdir(dir=,redirect=, switch=);
    options noxwait xsync;
    %if %length(&switch)=0 %then %let switch=b;
    data _null_; 
      xcmd='dir "' || "&dir" || '"' || "/&switch " || ">" || "&redirect";
      put 'generated the following command: ' xcmd=; 
      rc=system(xcmd);
      put 'result code of above command: ' rc=;
    run;
%mend getdir;

Образец вызова

%getdir(dir=c:\temp\,redirect=c:\temp\dir.txt) *run;

Если вы запускаете в пакетном режиме и у вас нет option noxwait xsync, задание зависнет на сервере в ожидании ответа оператора.

person CTKeane    schedule 11.09.2009