具体的な問題設定は,複数の入力文字列に対応させて,
データの入ったテーブルの各列で統計量を計算するというものでした.
(例えば1列目は最小値を、2列目は平均値...のように列ごとに設定する)
まずはRで書いた,文字列で統計量を計算する関数を返す
ソースコードを載せます.
setfunc <- function(type){ if( type == "min" ){ return(min) }else if( type == "max" ){ return(max) }else if( type == "median" ){ return(median) }else if( type == "mean" ){ return(mean) } } d <- c(1:10,rep(10,5)) d f <- setfunc("mean") f(d) f <- setfunc("max") f(d) f <- setfunc("median") f(d) f <- setfunc("n") f(d)この実行結果は下記のようになる。
> d <- c(1:10,rep(10,5)) > d [1] 1 2 3 4 5 6 7 8 9 10 10 10 10 10 10 > f <- setfunc("mean") > f(d) [1] 7 > f <- setfunc("max") > f(d) [1] 10 > f <- setfunc("median") > f(d) [1] 8 > f <- setfunc("n") > f(d) エラー: 関数 "f" を見つけることができませんでしたこれをCで実装したらどうなるかとhttp://ujihisa.blogspot.com/ を書いているujihisaさんとskypeで2時間余り議論して,ようやく動いたのがこれ. medianについては未実装で,実行結果もありませんがご容赦を.
#include <stdio.h> #include <string.h> double mean(double d[],int n) { int i; double sum = 0.0; double *dp; for( i=0 ; i<n ; i++ ){ sum += d[i]; } return sum/n; } double median(double d[],int n) { return -1; } double min(double d[],int n) { int i; int idx = 0; // 最小値の添字 for( i=0 ; i<n ; i++ ){ if( d[idx] > d[i] ){ idx = i; } } return d[idx]; } double max(double d[],int n) { int i; int idx = 0; // 最大値の添字 for( i=0 ; i<n ; i++ ){ if( d[idx] < d[i] ){ idx = i; } } return d[idx]; } double (*p[])(double [],int)={mean,median,min,max,NULL}; char *cp[]={"mean","median","min","max",NULL}; double (*setfunc(char *str))(double d[],int n) { int i; for( i=0 ; cp[i] != NULL ; i++ ){ if( !strcmp(cp[i],str) ){ return p[i]; } } printf("error in setfunc\n"); return NULL; // 文字列に一致したものがなかった } int main(void) { double (*f)(double d[],int n); double a[10]={0,1,2,3,4,5,6,7,8,9.0}; f = setfunc("mean"); printf("%lf\n",f(a,10)); f = setfunc("min"); printf("%lf\n",f(a,10)); f = setfunc("max"); printf("%lf\n",f(a,10)); return 0; }
すぐに思いつく改良点は,
・*pと*cpをバラバラではなく,構造体でまとめて持たせる
・長さについては,入力エラーチェックが必要.
といったところでしょうか.また,改良して議論したいと思います.
今日の結論としては,Rと比較すると,C言語の場合はプログラマがポインタをいちいち作らないといけないので,非常に面倒で,かつ間違えやすいということです.
言語の特徴を知って,実装に最適なものを選べということですね.
追記(2011/04)
上記の改良、および中央値の実装を行いました。
http://entertainment-lab.blogspot.com/2009/12/rc.html
0 件のコメント:
コメントを投稿