The Nameless City

何故か製薬やSAS関連のブログ、の予定。

2024-01-01から1年間の記事一覧

SAS以外での、日付・日時の取り扱いを少しまとめておく

その前に:ロケールと時刻の話。 当初は、NTPなんてものはなく、各PCの時刻がベース、UTCとか知らんがなというような状況ではあったのだが、 R言語 参考: 9 日付型データ | 疫学のための R ハンドブック Rによるデータ解析のための前処理 - Appendix D — コ…

JSONのファイルサイズを小さくするのにあるいくつかの話を。

minimizedする JSONでは改行不要、スペース不要の為、その辺りを削ると結構サイズ減ります。これを圧縮と呼ぶ場合あります。 ファイルをzip圧縮する 一応ベタな方法なので、まあまあそのまま。 カラム指向の表現形式という事にして、重複記述を削るような事…

Dataset-JSONの、その先

メタデータのもたせ方が、JSON Schema派生じゃなくなるかもしれない。 いわゆるテーブルのスキーマ定義の話なんですが、現状ではJSON SchemaよりもProtocol Buffersなどのプログラム言語の定義に近い形の一般化になりつつあります。 この辺りで一般情報引っ…

有効桁数は変数にそのまんまは格納されない(SASでもそうだし他のプログラム言語でも)。

いわゆる有効桁数について、いい加減DMが解析に聞くのは止めた方がいい。 てか、DMがEDCからの出力で有効桁数をどうやって格納するか設計してるはずなんだがという話・・・・・・ SASフォーマットで有効桁数を表す場合、設計時に有効桁数定義をしているとい…

Gitをそろそろ環境に導入した方がいいのかもだが、Gitを使いこなせないと無理な気もするので難しいなあ。

Waterfallタイプの開発が出来ていればいいのですが、そうはいかないのが常でして。 そのために古来よりSubversionやGitというバージョン管理ツールがあるのですが、それがナカナカどうかなというところがあり。 ファイルのタイムスタンプだとか含めてなんと…

「設定より規約」

うん、まあ、その、なんというか。官公庁系の決める規約等では、あまりこれが徹底されていないというか、そもそもSDTM/ADaMがちょっと柔軟性を高くしたうえで幾つもの内部構造のバリエーションを持つようになってしまっているので問題が大きいというところで…

モダンブラウザの技術ベースなアプリは、時々読み込み失敗して、一部分謎なブランクが発生したりするが、ネットワークがリッチな状況前提だったりする。

タイトルで言い尽くした感。 昔はボタンクリックとかの明確なアクションベースでリロードとかのイベント動かしていたのが、スクロールだとかふわふわしたものの動きで表示変えるようになり、結構練り込まれづらい気がする。 操作マニュアル作りづらい。

違うドメインの資格情報を利用する場合に、短いドメイン名のやつ使うのは非推奨。

って思ってください。真面目にフルパスで@形式のパターンで書いた方がいいです。 learn.microsoft.com ユーザ名では省略形なんかをいろいろ書くことが可能なのですが、この省略名、ドメインを超えると通じにくくなります(実際にはユーザを探すロジックがあ…

RTFはUnicodeはネイティブで扱ってないんだね・・・・・・

SASのUnicode版でRTFを出力したら、Windows-1252で出てくるのを見て。 ロケールは日本環境ではあるので、SASの環境としてもUnicodeではあれど日本語ログも出るところでやってるし、なんでかなと思ったら、 Unicodeに関しては前述の通りRTF 1.5以降でサポート…

サーバーで共通化している場合、WORKライブラリの置き場所変えた方がいいと思うんだけどね。

例えばSASがクラッシュした時にそこにファイルが残存するわけで、それ探して消すのに、デフォルトの各ユーザの%temp%にWORKライブラリ置くとかダルい気がするんですよね。 なので、インストール時に変えてくださいな。 普通のconfig修正方法はこれなんですが…

ある程度の技術動向の話(2024年版)

開発環境 VM→Docker SVN→Gitあんまり進化はない IDE Atom→VSCodeVSCodeクローンもあるようで。 統計解析の言語 Python、Rがとは言われるが、あまり大勢は変わらず。この辺り、実は統計解析→メディカルライティングとの絡みが発生するのであればもう少し進展…

SASやっている人間がSQLを知らなくていいというのはなくて、多分データ加工しているならむしろ最初にしておいた方がいい。

むしろ、RDBMSとSQLの基礎知識レベルは必須、むしろそこからアレンジされたDBとかも知識必要にはなってくるという認識です。 ちなみに私は、RDBMSが先です。 データを保存するという役割で、RDBMSは標準的に用いられる 通常のプログラム開発では、とても当た…