在C中拆分字符串,每个白色

9ceoxa92  于 2022-12-22  发布在  其他
关注(0)|答案(9)|浏览(142)

我想用C语言编写一个程序,把一个完整句子中的每个单词(作为输入)单独显示在一行中,这是我目前所做的:

void manipulate(char *buffer);
int get_words(char *buffer);

int main(){
    char buff[100];

    printf("sizeof %d\nstrlen %d\n", sizeof(buff), strlen(buff));   // Debugging reasons

    bzero(buff, sizeof(buff));

    printf("Give me the text:\n");
    fgets(buff, sizeof(buff), stdin);

    manipulate(buff);
    return 0;
}

int get_words(char *buffer){                                        // Function that gets the word count, by counting the spaces.
    int count;
    int wordcount = 0;
    char ch;

    for (count = 0; count < strlen(buffer); count ++){
        ch = buffer[count];
        if((isblank(ch)) || (buffer[count] == '\0')){                   // if the character is blank, or null byte add 1 to the wordcounter
            wordcount += 1;
        }
    }
    printf("%d\n\n", wordcount);
    return wordcount;
}

void manipulate(char *buffer){
    int words = get_words(buffer);
    char *newbuff[words];
    char *ptr;
    int count = 0;
    int count2 = 0;
    char ch = '\n';
    
    ptr = buffer;
    bzero(newbuff, sizeof(newbuff));

    for (count = 0; count < 100; count ++){
        ch = buffer[count];
        if (isblank(ch) || buffer[count] == '\0'){
            buffer[count] = '\0';
            if((newbuff[count2] = (char *)malloc(strlen(buffer))) == NULL) {
                printf("MALLOC ERROR!\n");
                exit(-1);
            }
            strcpy(newbuff[count2], ptr);
            printf("\n%s\n",newbuff[count2]);
            ptr = &buffer[count + 1];
            count2 ++;
        }
    }
}

虽然输出是我想要的,但是在显示的最后一个单词后面有很多空格,并且malloc()返回NULL,所以最后显示MALLOC ERROR!。我可以理解在我的malloc()实现中有一个错误,但是我不知道它是什么。
有没有其他更优雅或更好的方式来做呢?

hxzsmxv2

hxzsmxv21#

http://www.cplusplus.com/reference/clibrary/cstring/strtok/
看看这个,用空白字符作为分隔符。如果你需要更多的提示,让我知道。
从网站:

char * strtok ( char * str, const char * delimiters );

在第一次调用时,该函数需要一个C字符串作为str的参数,其第一个字符用作扫描标记的起始位置;在后续调用中,该函数需要一个空指针,并使用最后一个标记末尾之后的位置作为新的扫描起始位置。
一旦在对strtok的调用中找到str的终止空字符,则对该函数的所有后续调用(以空指针作为第一个参数)都将返回空指针。
参数编号

  • 应力
  • 要截断的C字符串。
  • 注意,这个字符串被修改为更小的字符串(token),或者指定一个空指针,在这种情况下,函数继续扫描上一次成功调用函数结束的地方。
  • 定界符
  • 包含分隔符的C字符串。
  • 这些可能因呼叫而异。

返回值

指向字符串中最后一个标记的指针。如果没有标记可供检索,则返回空指针。

示例

/* strtok example */
#include <stdio.h>
#include <string.h>

int main ()
{
  char str[] ="- This, a sample string.";
  char * pch;
  printf ("Splitting string \"%s\" into tokens:\n",str);
  pch = strtok (str," ,.-");
  while (pch != NULL)
  {
    printf ("%s\n",pch);
    pch = strtok (NULL, " ,.-");
  }
  return 0;
}
9udxz4iz

9udxz4iz2#

为了好玩,这里有一个基于回调方法的实现:

const char* find(const char* s,
                 const char* e,
                 int (*pred)(char))
{
    while( s != e && !pred(*s) ) ++s;
    return s;
}

void split_on_ws(const char* s,
                 const char* e,
                 void (*callback)(const char*, const char*))
{
    const char* p = s;
    while( s != e ) {
        s = find(s, e, isspace);
        callback(p, s);
        p = s = find(s, e, isnotspace);
    }
}

void handle_word(const char* s, const char* e)
{
    // handle the word that starts at s and ends at e
}

int main()
{
    split_on_ws(some_str, some_str + strlen(some_str), handle_word);
}
u5rb5r59

u5rb5r593#

malloc(0)可以(可选地)返回NULL,这取决于实现。您是否意识到您可能调用malloc(0)的原因?或者更准确地说,您是否看到您正在阅读和写入超出数组大小的位置?

798qvoo8

798qvoo84#

考虑使用strtok_r,就像其他人建议的那样,或者类似于:

void printWords(const char *string) {
    // Make a local copy of the string that we can manipulate.
    char * const copy = strdup(string);
    char *space = copy;
    // Find the next space in the string, and replace it with a newline.
    while (space = strchr(space,' ')) *space = '\n';
    // There are no more spaces in the string; print out our modified copy.
    printf("%s\n", copy);
    // Free our local copy
    free(copy);
}
cgyqldqp

cgyqldqp5#

出错的地方是get_words()总是返回比实际字数少一的值,因此最终您尝试:

char *newbuff[words]; /* Words is one less than the actual number,
so this is declared to be too small. */

newbuff[count2] = (char *)malloc(strlen(buffer))

最终,count2总是比您为newbuff[]声明的元素数多一个,但我不知道为什么malloc()没有返回有效的ptr。

hec6srdp

hec6srdp6#

你应该malloc'ing strlen(ptr),而不是strlen(buf).另外,你的count2应该被限制在单词的数量.当你到达你的字符串的末尾,你继续检查你的缓冲区中的零,并添加零大小的字符串到你的数组.

u4dcyp6a

u4dcyp6a7#

作为C语言中字符串操作的一种不同风格,这里有一个例子,它不修改源字符串,也不使用malloc。为了查找空格,我使用了libc函数strpbrk

int print_words(const char *string, FILE *f)
{
   static const char space_characters[] = " \t";
   const char *next_space;

   // Find the next space in the string
   //
   while ((next_space = strpbrk(string, space_characters)))
   {
      const char *p;

      // If there are non-space characters between what we found
      // and what we started from, print them.
      //
      if (next_space != string)
      {
         for (p=string; p<next_space; p++)
         {
            if(fputc(*p, f) == EOF)
            {
               return -1;
            }
         }

         // Print a newline
         //
         if (fputc('\n', f) == EOF)
         {
            return -1;
         }
      }

      // Advance next_space until we hit a non-space character
      //
      while (*next_space && strchr(space_characters, *next_space))
      {
         next_space++;
      }

      // Advance the string
      //
      string = next_space;
   }

   // Handle the case where there are no spaces left in the string
   //
   if (*string)
   {
      if (fprintf(f, "%s\n", string) < 0)
      {
         return -1;
      }
   }

   return 0;
}
6tdlim6h

6tdlim6h8#

你可以扫描字符数组来寻找标记如果你找到了它就打印新行否则打印字符r。

#include <stdio.h>
    #include <stdlib.h>
    #include <string.h>

    int main()
    {
        char *s;
        s = malloc(1024 * sizeof(char));
        scanf("%[^\n]", s);
        s = realloc(s, strlen(s) + 1);
        int len = strlen(s);
        char delim =' ';
        for(int i = 0; i < len; i++) {
            if(s[i] == delim) {
                printf("\n");
            }
            else {
                printf("%c", s[i]);
            }
        }
        free(s);
        return 0;
    }
wko9yo5t

wko9yo5t9#

char arr[50];
gets(arr);
int c=0,i,l;
l=strlen(arr);

    for(i=0;i<l;i++){
        if(arr[i]==32){
            printf("\n");
        }
        else
        printf("%c",arr[i]);
    }

相关问题